Sa lá atá inniu ann, ní ola, ach sonraí, an acmhainn is luachmhaire ar domhan. Tá an léirshamhlú ag éirí mar uirlis níos tábhachtaí chun ciall a bhaint as na billiúin sraitheanna sonraí. Trí shonraí a aistriú go léiriú grafach atá éasca le léirmhíniú, cuidíonn léirshamhlú sonraí sa scéalaíocht sonraí trí aird a tharraingt ar fhaisnéis, ar phatrúin agus ar asluitigh ábhartha. Mar sin féin, ní mór do na sonraí agus na grafaicí oibriú le chéile: Is é an ealaín a bhaineann le hanailís iontach a chomhtháthú le scéalaíocht iontach. Sa bhlagphost seo, taispeánfaimid "Sea Born" duit, ceann de na huirlisí léirshamhlaithe is cáiliúla atá scríofa i Python.
Uirlisí léirshamhlaithe
Bainimid úsáid as uirlisí Amharcléiriú chun na treochtaí, patrúin, asluitigh agus an gaol idir athróga a shamhlú. Is scil a bhfuil an-éileamh uirthi go háirithe do ghairm bheatha san eolaíocht sonraí.
Seaborn
Is leabharlann léirshamhlaithe sonraí Python é Seaborn bunaithe ar matplotlib. Soláthraíonn sé comhéadan ardleibhéil chun grafaic staidrimh tharraingteach agus fhaisnéiseach a tharraingt.
Feidhmeanna breacadh mara:
I seaborn, tá 3 chatagóir ceapacha againn
-
Ceapacha catagóiriúla.
-
Ceapacha dáileacháin.
-
Ceapacha coibhneasta.
Ceapacha catagóiriúla
Bainimid úsáid as feidhmeanna breacadóireachta catagóiriúla na mara chun treochtaí athróg chatagóirí a shamhlú nó chun an gaol idir dhá athróg a shamhlú le ceann catagóiriúil amháin ar a laghad.
Ceapaire comhairimh:
- Taispeánann sé an t-áireamh ar bhreathnuithe ó gach catagóir ón athróg chatagóireach. Níl le déanamh againn ach líon na mbreathnuithe i ngach catagóir den athróg a chomhaireamh
seaborn.catplot(kind = 'count',
data = dataset,
x = 'variable')
Plota barra:
-
Is ionann é agus meastachán ar chlaonadh athróige leanúnaí le airde na dronuilleoige do gach catagóir d’athróg chatagóireach. Mar sin glacann an fheidhm bhreacadh dhá athróg mar ionchur, ceann atá leanúnach agus ceann atá catagóiriúil. Maidir le gach catagóir ó athróg_1, ríomhaimid claonadh athróg_2.
-
Is féidir an meán, an t-athraitheas a bheith sa chlaonadh, nó is féidir leat feidhm shaincheaptha éigin a phasáil…
seaborn.catplot(kind = 'bar',**data = dataset,**
x = 'variable_1',**y = 'variable_2',**
estimator = np.mean)**
Stiallacha:
- Tá stiallphlota ar cheann de na ceapacha is simplí agus is simplí san léirshamhlú sonraí, tarraingímid go simplí pointí a léiríonn luachanna athróg leanúnaigh.
seaborn.catplot(kind = 'strip',
data = dataset,
x = 'variable_1',
y = 'variable_2',
jitter = 0.15)
Plota Swarm:
-
Tá plota Swarm chomh cosúil leis an stiallphlota, ós rud é go bhfuil an fheidhmiúlacht chéanna aige. Is é an t-aon difríocht ná an chaoi a dtaispeánann sé na pointí. Cé gur i stiallphlota, féadfaidh pointí sonraí forluí ós rud é go gcuirtear ar an x-ais iad go randamach, sa phlota swarm déanaimid cinnte nach dtiocfaidh forluí ar na pointí trí iad a chruachadh ar bharr a chéile.
-
Is é an míbhuntáiste anseo ná má tá go leor pointí sonraí againn, go mbeadh sé dodhéanta gan iad a fhorluí, agus mar sin scriosfaidh an algartam roinnt pointí sonraí ionas nach mbeidh siad ag forluí.
seaborn.catplot(kind = 'swarm',
data = dataset,
x = 'variable_1',
y = 'variable_2')
Boscaphlota:
-
Úsáidtear plota bosca chun dáileadh athróige leanúnaí a léiriú do gach catagóir d’athróg chatagóireach. Cé go bhfuil sé simplí go leor, tugann sé go leor faisnéise:
-
Luachanna na gceathairíl:
Tá líne chothrománach taobh istigh den bhosca, rud a léiríonn an t-airmheán. Is é an líne chothrománach thuas ná na ceathairílí uachtaracha, is é an ceann thíos na ceathairílí íochtair.
- Na asluiteacha:
Tabhair faoi deara go bhfuil roinnt pointí taobh amuigh den bhosca, seasann na pointí seo do na asluitigh
seaborn.catplot(kind = 'box',
data = dataset,
x = 'variable_1',
y = 'variable_2')
Ceap veidhlín:
In ionad an bosca dáileacháin a bhreacadh, ceapfaidh breacadh veidhlín dáileadh iarbhír na hathróige leanúnaí do gach catagóir den athróg chatagóireach ag úsáid KDE ( Meastachán Dlúis Eithne )
seaborn.catplot(kind = 'violin',
data = dataset,
x = 'variable_1',
y = 'variable_2')
Ceapacha dáileacháin:
Bainimid úsáid as feidhmeanna breacála dáilte na mara chun dáileadh na n-athróg leanúnach a shamhlú.
A phlota:
Léiríonn an plota hist dáileadh na n-athróg leanúnach ag baint úsáide as boscaí bruscair.
seaborn.distplot(kind = 'hist',
data = dataset,
x = 'variable',
bins = 20)
plota KDE:
Léiríonn plota Kde dáileadh iarbhír na sonraí, ag baint úsáide as an Meastachán Dlús Eithne.
seaborn.distplot(kind = 'kde',
data = dataset,
x = 'variable')
Is féidir é a úsáid freisin chun dáileadh débhathrálach dhá athróg leanúnacha a léiriú.
seaborn.distplot(kind = 'kde',
data = dataset,
x = 'variable_1',
y = 'variable_2')
plota ECDF:
Léiríonn plota ECDF dáileadh carnach eimpíreach athróige leanúnaí.
seaborn.distplot(kind = 'ecdf',
data = dataset,
x = 'variable')
Ceapacha coibhneasta:
Bainimid úsáid as na feidhmeanna coibhneasacha plotála de mhuirbheirthe chun an gaol idir athróga leanúnacha a shamhlú.
Ceaptha scaipthe:
- Taispeánann sé an gaol idir dhá athróg leanúnacha, go simplí trí na pointí sonraí go léir a bhreacadh.
seaborn.relplot(kind = 'scatter',
data = dataset,
x = 'variable_1',
y = 'variable_2')
Ceart líne:
- Léiríonn sé an gaol idir athróga mar fheidhm leanúnach.
seaborn.relplot(kind = 'line',
data = dataset,
x = 'variable_1',
y = 'variable_2')
Tuilleadh feidhmiúlachtaí:
B’fhéidir gur thug tú faoi deara go bhfuil uasmhéid de dhá athróg in aghaidh an phlota á n-úsáid againn sna feidhmeanna breacadóireachta go léir, ach cad é má theastaíonn uainn níos mó athróg a thabhairt isteach inár léirshamhlú ? Ar ámharaí an tsaoil thug Seaborn aire de sin:
Lí:
- Ag baint úsáide as hue is féidir linn 3ú athróg a thabhairt isteach atá catagóiriúil dár léirshamhlú trí úsáid a bhaint as ionchódú datha, ciallaíonn sé go mbeidh an dath céanna ar na pointí sonraí a bhaineann leis an gcatagóir chéanna den 3ú athróg seo.
seaborn.relplot(kind = 'scatter',
data = dataset,
x = 'variable_1',
y = 'variable_2',
hue = 'variable_3')
Méid:
- Tá an méid cosúil le lí, ach úsáidtear ionchódú méide in ionad ionchódú datha. Ciallaíonn sé go mbeidh an méid uathúil céanna ag na pointí sonraí a bhaineann leis an gcatagóir chéanna den 3ú athróg. Ciallaíonn méideanna éagsúla catagóirí éagsúla.
seaborn.relplot(kind = 'scatter',
data = dataset,
x = 'variable_1',
y = 'variable_2',
size = 'variable_3',
sizes = [50, 100])
Stíl:
- An rud céanna go leor le Lí agus Méid, Ciallaíonn sé go mbeidh an stíl uathúil chéanna ag na pointí sonraí a bhaineann leis an gcatagóir chéanna den 3ú athróg. Is féidir le pointe stíl a bheith ina ponc, réalta, cros, triantán, … tugaimid marcóirí orthu.
seaborn.relplot(kind = 'scatter',
data = dataset,
x = 'variable_1',
y = 'variable_2',
style = 'variable_3',
markers = ['X', '*'])
Is féidir linn athróg chatagóireach nua a thabhairt isteach freisin ag baint úsáide as ceapacha iolracha, baineann gach ceap le catagóir ón athróg chatagóireach cate:
Col:
Cruthóidh sé go leor figiúirí go cothrománach maidir le catagóirí an 3ú athróg.
seaborn.relplot(kind = 'scatter',
data = dataset,
x = 'variable_1',
y = 'variable_2',
col = 'variable_3')
Ra:
Cruthófar go leor figiúirí go hingearach maidir le catagóirí an 3ú athróg.
seaborn.relplot(kind = 'scatter',
data = dataset,
x = 'variable_1',
y = 'variable_2',
row = 'variable_3')
Is féidir linn Lí agus Méid a úsáid sa phlota céanna freisin, chun 4 athróg a léiriú, nó fiú Lí agus Stíl agus Col, chun 5 athróg a úsáid sa phlota céanna! Is féidir linn suas le 7 n-athróg a úsáid (athróg 1, athróg 2, Lí, Méid, Stíl, Col, Rae ) sa phlota céanna, ach tabharfaidh sé plean an-mhuirear dúinn atá chomh messy agus thar a bheith deacair a léirmhíniú, uaireanta ní faisnéiseach ar chor ar bith.
seaborn.relplot(kind = 'scatter',
data = dataset,
x = 'variable_1',
y = 'variable_2',
hue = 'variable_3',
size = 'variable_4')
Conclúid:
Sa phost seo, d'fhoghlaimíomar faoi mhuirbheirthe, a 3 chatagóir feidhmeanna breacála: Ceapacha Catagóireacha, Dáileacháin agus Coibhneasta, agus mhínigh muid gach feidhm bhreacadh do gach catagóir, go léir chomh maith leis an gcód python.
Breathnaigh ar ár Buschampa Eolaíochta Sonraí chun tuilleadh a fhoghlaim faoin ábhar seo!