Amharcléiriú Sonraí i Python le Seaborn

python
léirshamhlú sonraí
seaborn
Amharcléiriú Sonraí i Python le Seaborn cover image

Sa lá atá inniu ann, ní ola, ach sonraí, an acmhainn is luachmhaire ar domhan. Tá an léirshamhlú ag éirí mar uirlis níos tábhachtaí chun ciall a bhaint as na billiúin sraitheanna sonraí. Trí shonraí a aistriú go léiriú grafach atá éasca le léirmhíniú, cuidíonn léirshamhlú sonraí sa scéalaíocht sonraí trí aird a tharraingt ar fhaisnéis, ar phatrúin agus ar asluitigh ábhartha. Mar sin féin, ní mór do na sonraí agus na grafaicí oibriú le chéile: Is é an ealaín a bhaineann le hanailís iontach a chomhtháthú le scéalaíocht iontach. Sa bhlagphost seo, taispeánfaimid "Sea Born" duit, ceann de na huirlisí léirshamhlaithe is cáiliúla atá scríofa i Python.

Uirlisí léirshamhlaithe

Bainimid úsáid as uirlisí Amharcléiriú chun na treochtaí, patrúin, asluitigh agus an gaol idir athróga a shamhlú. Is scil a bhfuil an-éileamh uirthi go háirithe do ghairm bheatha san eolaíocht sonraí.

Seaborn

Is leabharlann léirshamhlaithe sonraí Python é Seaborn bunaithe ar matplotlib. Soláthraíonn sé comhéadan ardleibhéil chun grafaic staidrimh tharraingteach agus fhaisnéiseach a tharraingt.

Feidhmeanna breacadh mara:

I seaborn, tá 3 chatagóir ceapacha againn

  • Ceapacha catagóiriúla.

  • Ceapacha dáileacháin.

  • Ceapacha coibhneasta.


Ceapacha catagóiriúla

Bainimid úsáid as feidhmeanna breacadóireachta catagóiriúla na mara chun treochtaí athróg chatagóirí a shamhlú nó chun an gaol idir dhá athróg a shamhlú le ceann catagóiriúil amháin ar a laghad.

Ceapaire comhairimh:

  • Taispeánann sé an t-áireamh ar bhreathnuithe ó gach catagóir ón athróg chatagóireach. Níl le déanamh againn ach líon na mbreathnuithe i ngach catagóir den athróg a chomhaireamh
seaborn.catplot(kind = 'count',
                data = dataset,
                x    = 'variable')

Count plot

Plota barra:

  • Is ionann é agus meastachán ar chlaonadh athróige leanúnaí le airde na dronuilleoige do gach catagóir d’athróg chatagóireach. Mar sin glacann an fheidhm bhreacadh dhá athróg mar ionchur, ceann atá leanúnach agus ceann atá catagóiriúil. Maidir le gach catagóir ó athróg_1, ríomhaimid claonadh athróg_2.

  • Is féidir an meán, an t-athraitheas a bheith sa chlaonadh, nó is féidir leat feidhm shaincheaptha éigin a phasáil…

seaborn.catplot(kind = 'bar',**data = dataset,**
                x    = 'variable_1',**y    = 'variable_2',**
                estimator = np.mean)**

Bar Plot

Stiallacha:

  • Tá stiallphlota ar cheann de na ceapacha is simplí agus is simplí san léirshamhlú sonraí, tarraingímid go simplí pointí a léiríonn luachanna athróg leanúnaigh.

Strip Plot

seaborn.catplot(kind = 'strip',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2',
                jitter = 0.15)

Plota Swarm:

  • Tá plota Swarm chomh cosúil leis an stiallphlota, ós rud é go bhfuil an fheidhmiúlacht chéanna aige. Is é an t-aon difríocht ná an chaoi a dtaispeánann sé na pointí. Cé gur i stiallphlota, féadfaidh pointí sonraí forluí ós rud é go gcuirtear ar an x-ais iad go randamach, sa phlota swarm déanaimid cinnte nach dtiocfaidh forluí ar na pointí trí iad a chruachadh ar bharr a chéile.

  • Is é an míbhuntáiste anseo ná má tá go leor pointí sonraí againn, go mbeadh sé dodhéanta gan iad a fhorluí, agus mar sin scriosfaidh an algartam roinnt pointí sonraí ionas nach mbeidh siad ag forluí.

Swarm Plot

seaborn.catplot(kind = 'swarm',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2')

Boscaphlota:

  • Úsáidtear plota bosca chun dáileadh athróige leanúnaí a léiriú do gach catagóir d’athróg chatagóireach. Cé go bhfuil sé simplí go leor, tugann sé go leor faisnéise:

  • Luachanna na gceathairíl:

Tá líne chothrománach taobh istigh den bhosca, rud a léiríonn an t-airmheán. Is é an líne chothrománach thuas ná na ceathairílí uachtaracha, is é an ceann thíos na ceathairílí íochtair.

  • Na asluiteacha:

Tabhair faoi deara go bhfuil roinnt pointí taobh amuigh den bhosca, seasann na pointí seo do na asluitigh

Box Plot

seaborn.catplot(kind = 'box',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2')

Ceap veidhlín:

In ionad an bosca dáileacháin a bhreacadh, ceapfaidh breacadh veidhlín dáileadh iarbhír na hathróige leanúnaí do gach catagóir den athróg chatagóireach ag úsáid KDE ( Meastachán Dlúis Eithne )

Violin Plot

seaborn.catplot(kind = 'violin',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2')

Ceapacha dáileacháin:

Bainimid úsáid as feidhmeanna breacála dáilte na mara chun dáileadh na n-athróg leanúnach a shamhlú.

A phlota:

Léiríonn an plota hist dáileadh na n-athróg leanúnach ag baint úsáide as boscaí bruscair.

Hist Plot

seaborn.distplot(kind = 'hist',
                 data = dataset,
                 x    = 'variable',
                 bins = 20)

plota KDE:

Léiríonn plota Kde dáileadh iarbhír na sonraí, ag baint úsáide as an Meastachán Dlús Eithne.

KDE Plot

seaborn.distplot(kind = 'kde',
                 data = dataset,
                 x    = 'variable')

Is féidir é a úsáid freisin chun dáileadh débhathrálach dhá athróg leanúnacha a léiriú.

KDE Plot

seaborn.distplot(kind = 'kde',
                 data = dataset,
                 x    = 'variable_1',
                 y    = 'variable_2')

plota ECDF:

Léiríonn plota ECDF dáileadh carnach eimpíreach athróige leanúnaí.

ECDF Plot

seaborn.distplot(kind = 'ecdf',
                 data = dataset,
                 x    = 'variable')

Ceapacha coibhneasta:

Bainimid úsáid as na feidhmeanna coibhneasacha plotála de mhuirbheirthe chun an gaol idir athróga leanúnacha a shamhlú.

Ceaptha scaipthe:

  • Taispeánann sé an gaol idir dhá athróg leanúnacha, go simplí trí na pointí sonraí go léir a bhreacadh.

Scatter Plot

seaborn.relplot(kind = 'scatter',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2')

Ceart líne:

  • Léiríonn sé an gaol idir athróga mar fheidhm leanúnach.

Line Plot

seaborn.relplot(kind = 'line',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2')

Tuilleadh feidhmiúlachtaí:

B’fhéidir gur thug tú faoi deara go bhfuil uasmhéid de dhá athróg in aghaidh an phlota á n-úsáid againn sna feidhmeanna breacadóireachta go léir, ach cad é má theastaíonn uainn níos mó athróg a thabhairt isteach inár léirshamhlú ? Ar ámharaí an tsaoil thug Seaborn aire de sin:

Lí:

  • Ag baint úsáide as hue is féidir linn 3ú athróg a thabhairt isteach atá catagóiriúil dár léirshamhlú trí úsáid a bhaint as ionchódú datha, ciallaíonn sé go mbeidh an dath céanna ar na pointí sonraí a bhaineann leis an gcatagóir chéanna den 3ú athróg seo.

Hue

seaborn.relplot(kind = 'scatter',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2',
                hue  = 'variable_3')

Méid:

  • Tá an méid cosúil le lí, ach úsáidtear ionchódú méide in ionad ionchódú datha. Ciallaíonn sé go mbeidh an méid uathúil céanna ag na pointí sonraí a bhaineann leis an gcatagóir chéanna den 3ú athróg. Ciallaíonn méideanna éagsúla catagóirí éagsúla.

Size

seaborn.relplot(kind = 'scatter',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2',
                size = 'variable_3',
                sizes = [50, 100])

Stíl:

  • An rud céanna go leor le Lí agus Méid, Ciallaíonn sé go mbeidh an stíl uathúil chéanna ag na pointí sonraí a bhaineann leis an gcatagóir chéanna den 3ú athróg. Is féidir le pointe stíl a bheith ina ponc, réalta, cros, triantán, … tugaimid marcóirí orthu.

Style

seaborn.relplot(kind = 'scatter',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2',
                style = 'variable_3',
                markers = ['X', '*'])

Is féidir linn athróg chatagóireach nua a thabhairt isteach freisin ag baint úsáide as ceapacha iolracha, baineann gach ceap le catagóir ón athróg chatagóireach cate:

Col:

Cruthóidh sé go leor figiúirí go cothrománach maidir le catagóirí an 3ú athróg.

Col

seaborn.relplot(kind = 'scatter',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2',
                col  = 'variable_3')

Ra:

Cruthófar go leor figiúirí go hingearach maidir le catagóirí an 3ú athróg.

Row

seaborn.relplot(kind = 'scatter',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2',
                row  = 'variable_3')

Is féidir linn Lí agus Méid a úsáid sa phlota céanna freisin, chun 4 athróg a léiriú, nó fiú Lí agus Stíl agus Col, chun 5 athróg a úsáid sa phlota céanna! Is féidir linn suas le 7 n-athróg a úsáid (athróg 1, athróg 2, Lí, Méid, Stíl, Col, Rae ) sa phlota céanna, ach tabharfaidh sé plean an-mhuirear dúinn atá chomh messy agus thar a bheith deacair a léirmhíniú, uaireanta ní faisnéiseach ar chor ar bith.

Hue & Size

seaborn.relplot(kind = 'scatter',
                data = dataset,
                x    = 'variable_1',
                y    = 'variable_2',
                hue  = 'variable_3',
                size = 'variable_4')

Conclúid:

Sa phost seo, d'fhoghlaimíomar faoi mhuirbheirthe, a 3 chatagóir feidhmeanna breacála: Ceapacha Catagóireacha, Dáileacháin agus Coibhneasta, agus mhínigh muid gach feidhm bhreacadh do gach catagóir, go léir chomh maith leis an gcód python.

Breathnaigh ar ár Buschampa Eolaíochta Sonraí chun tuilleadh a fhoghlaim faoin ábhar seo!


Career Services background pattern

Seirbhísí Gairme

Contact Section background image

Bígí i dteagmháil

Code Labs Academy © 2024 Gach ceart ar cosaint.