Wprowadzenie do Srodowiska R_Komsta.pdf

(955 KB) Pobierz
Wprowadzenie do srodowiska R
Wprowadzeniedo±rodowiskaR
ŁukaszKomsta
21sierpnia2004
Spistre±ci
1Wst¦p
3
2Pierwszekroki 3
2.1Najprostszeobliczenia.................................. 4
2.2Przykładyoperacjinawektorach............................ 4
2.3Najprostszaregresja................................... 6
3Strukturydanych 7
3.1Wektory.......................................... 7
3.1.1Generowanieci¡gów............................... 7
3.1.2 Indeksowaniewektorów............................. 8
3.1.3Operacjearytmetyczne.............................. 9
3.1.4Funkcjeoperuj¡cenawektorach........................ 11
3.2Faktoryidanekategoryczne............................... 12
3.3Tablice........................................... 14
3.3.1Tworzenieiindeksowanietablic......................... 14
3.3.2Operacjenatablicach.............................. 16
3.4Listy............................................ 17
3.5Ramki........................................... 18
4Rozkładyzmiennych 20
5Wykresy 21
5.1Wykresysłupkowe.................................... 21
5.2Wykresykołowe ..................................... 22
5.3Histogramyiwykresyrozrzutuzmiennej........................ 22
5.4Wykresydwuwymiarowe................................. 25
5.5Wykresyfunkcji ..................................... 26
5.6Ogólneparametryfunkcjirysuj¡cych.......................... 26
1
99715613.002.png
ŁukaszKomsta Wprowadzeniedo±rodowiskaR
6Najcz¦±ciejstosowanetestystatystyczne 27
6.1Testydlajednejpróby.................................. 27
6.2Testydladwóchprób.................................. 28
6.3Testydlawi¦kszejilo±ciprób.............................. 29
6.4DwuczynnikowaANOVA................................ 30
6.5Testychi-kwadratdlaproporcji............................. 31
6.5.1Testchi-kwadratnazgodno±¢rozkładu.................... 32
6.6Testchi-kwadratnaniezale»no±¢............................ 32
6.7Pozostałetesty...................................... 32
7Analizaregresjiikorelacji 33
7.1Najprostszaregresjaliniowa............................... 33
7.2Regresjakwadratowaisze±cienna.Testynaliniowo±¢................. 34
7.3Regresjanieliniowa.................................... 36
8Codalej?
38
Warunkidystrybucji
Kopiowaniewformieelektronicznejdozwolonewył¡czniewpostaciniezmienionej,zzachowaniem
informacjioautorzeorazwarunkachdystrybucji,tylkowcelachniekomercyjnych.Przedruk,sprze-
da»iinneformywykorzystaniadozwolonewył¡czniezazgod¡autora.
Aktualnawersjadokumentu: 0.1
Stronadomowaautora: http://www.komsta.net.
Opracowaniezło»onowsystemieT E X/L A T E X.
2
99715613.003.png
ŁukaszKomsta Wprowadzeniedo±rodowiskaR
1.Wst¦p
R-projectjestpakietemmatematycznymprzeznaczonymdozaawansowanychoblicze«statystycz-
nych.Obj¦tyjestlicencj¡GPL,azatemjestprogramemcałkowiciebezpłatnymiwolnym.ro-
dowiskoiskładniaRjestbardzozbli»onadoj¦zykaS,stosowanegonp.wpakiecieS-plus.Mo»na
powiedzie¢,»eRjestjedn¡zimplementacjitegoj¦zyka.Pomi¦dzynimiistniej¡wprawdziepewne
(niekiedyistotne)ró»nice,jednakwi¦kszo±¢procedurikodunapisanegodlaSb¦dziedziała¢tak»e
wR.
Mo»liwo±cipakietuRs¡stosunkowodu»einieko«cz¡si¦nasamychtylkoobliczeniach.Umo»li-
wiaonrównie»tworzeniewykresówobardzodobrejjako±ci.Mog¡by¢onezapisywanewformatach
EPS,PDFiWMF,copozwalanałatwewł¡czenieichdopublikacjinaukowych.
Jednymznajwi¦kszych„problemów”dlapocz¡tkuj¡cegou»ytkownikaRjestfakt,i»program
tendziałanaodmiennejzasadzieodarkuszykalkulacyjnych.Pracaodbywasi¦wtrybiekomend,
wsposóbanalogicznydoDOS-a,czyte»rozbudowanegokalkulatora.Narzucatopewn¡dyscyplin¦
worganizacjidanychlubnazywaniuzmiennych.Jednaktakisystempracyjestnieocenionywprzy-
padkubardziejzaawansowanychoblicze«.Przypracyzarkuszemsporoczasuzajmujezaplanowanie
rozmieszczeniadanychiwyników.Tutajniemusimytegorobi¢,gdy»takiegorozmieszczeniapo
prostuniema.PonadtopakietRpozwalanawieleoblicze«,którychniedasi¦prostowykona¢
nawetnabardziejzaawansowanycharkuszachkalkulacyjnych.Jegofunkcjonalno±¢uzupełniaj¡
dodatkowebibliotekidokonkretnychzastosowa«,dostarczanewrazzobszern¡dokumentacj¡.
Celemniniejszegoopracowaniajestzapoznanieczytelnikazpodstawowymioperacjamidoko-
nywanymiprzyu»yciupakietuR.Zało»onotak»e,»eczytelnikznapodstawowepoj¦ciaitesty
statystyczne,atekttenpoka»etylkosposóbichprzeprowadzeniaprzyu»yciupakietu.Bardziej
zaawansowanekorzystaniezprogramupoci¡gakonieczno±¢studiowaniadokumentacjiangloj¦-
zycznej.Mamnadziej¦,»eudamisi¦wtymopracowaniuprzedstawi¢programRodnajlepszej
strony,zach¦caj¡cdodalszegoodkrywaniajegomo»liwo±ci.Zdaj¦sobierównie»spraw¦zniedo-
skonało±cininiejszegotekstu,prosz¡cowszelkieuwagiikomentarze(danekontaktowenamojej
stroniedomowej).
Programmo»napobra¢zestronydomowej,znajduj¡cejsi¦podadresem http://www.r-project.org.
Znajduj¡si¦tamzarówno¹ródłaprogramu,jakigotoweskompilowanepakietyzprzeznaczeniem
nakonkretnysystemoperacyjny(wprzypadkuWindowswrazzinstalatorem).
2.Pierwszekroki
Pouruchomieniuprogramuzobaczymyoknozawieraj¡cepowitanie,zbli»onenp.dotego:
R:Copyright2004,TheRFoundationforStatisticalComputing
Version1.9.0(2004-04-12),ISBN3-900051-00-3
RisfreesoftwareandcomeswithABSOLUTELYNOWARRANTY.
Youarewelcometoredistributeitundercertainconditions.
Type’license()’or’licence()’fordistributiondetails.
Risacollaborativeprojectwithmanycontributors.
Type’contributors()’formoreinformationand
’citation()’onhowtociteRinpublications.
3
99715613.004.png
ŁukaszKomsta Wprowadzeniedo±rodowiskaR
Type’demo()’forsomedemos,’help()’foron-linehelp,or
’help.start()’foraHTMLbrowserinterfacetohelp.
Type’q()’toquitR.
[Previouslysavedworkspacerestored]
>
Znak > jestzach¦t¡dowprowadzeniapolecenia( prompt ).Wszystkieoperacjewprogramie
Rdokonywanes¡przezwprowadzaniepolece«.Istniejemo»liwo±¢otrzymaniapomocynatemat
okre±lonejfunkcjipoprzeznapisaniejejnazwypoprzedzonejznakiemzapytania,np. ?sin .Mo»e-
myrównie»przeszukiwa¢wszystkieplikipomocypodk¡temwyst¡pieniaokre±lonegosłowa,np.
help.search("mean") .
2.1.Najprostszeobliczenia
Rmo»eby¢wykorzystywanyjakostosunkowoprecyzyjnykalkulator.Wystarczywprowadzi¢zadane
wyra»enie,aotrzymamyjegowynik.Popatrzmynaprzykłady:
>1+1
[1]2
>sqrt(30)
[1]5.477226
>log(100)
[1]4.60517
>log(100,10)
[1]2
>pi
[1]3.141593
>sin(30*pi/180)
[1]0.5
>1/(2*sqrt(45*89))
[1]0.007900758
>16^(0.5)
[1]4
Zwracamuwag¦nato,»eargumentyfunkcjitrygonometrycznychpodajesi¦wradianach.Nato-
miastfunkcja log dotyczylogarytmunaturalnego,alepodaj¡c10jakodrugijejargument,mo»na
otrzyma¢logarytmdziesi¦tny.
2.2.Przykładyoperacjinawektorach
Uwa»negoczytelnikazastanawiazapewnejedynkawnawiasiekwadratowym,umieszczonaprzed
ka»dymwynikiem.Otó»Rumo»liwiaorganizacj¦danychwró»nestruktury,anajprostsz¡znich
jestwektor( vector ).Jesttoserialiczbouporz¡dkowanejkolejno±ci.Wj¦zykuRniemaprostszych
struktur;zatempojedynczaliczbajestwektoremodługo±cirównej1.Jednakjedynkawnawiasie
nieoznaczadługo±ciwektora,lecznumerpierwszejpozycji,którapodanajestwdanymwierszu.
B¦dzietodoskonalewidocznewdalszychprzykładach.
4
 
ŁukaszKomsta Wprowadzeniedo±rodowiskaR
Nawektorachmo»nawykonywa¢przeró»neoperacje.Ichrezultatemjestrównie»wektor,któ-
regowszystkiedanezostaływodpowiednisposóbprzeliczone.
Abyprzedstawi¢podstawoweoperacjenawektorach,utworzymywektorzawieraj¡cy10liczb
izapami¦tamygowzmiennej dane .Nast¦pnieb¦dziemystaralisi¦wykona¢podstawoweoperacje
statystycznenatychwynikach.
>dane=c(10.34,10.87,10.32,9.64,10.39,9.48,10.55,9.36,9.67,10.58)
>dane
[1]10.3410.8710.329.6410.399.4810.559.369.6710.58
>summary(dane)
Min.1stQu.Median Mean3rdQu. Max.
9.360 9.64810.33010.12010.51010.870
>mean(dane)
[1]10.12
>shapiro.test(dane)
Shapiro-Wilknormalitytest
data:dane
W=0.9004,p-value=0.2216
>var(dane)
[1]0.2822667
>sd(dane)
[1]0.5312877
>1/dane
[1]0.096711800.091996320.096899220.103734440.096246390.10548523
[7]0.094786730.106837610.103412620.09451796
>sin(dane)
[1]-0.79269796-0.99212590-0.78034795-0.21356435-0.82217533-0.05519398
[7]-0.902363310.06473267-0.24277173-0.91488462
>dane^2
[1]106.9156118.1569106.502492.9296107.952189.8704111.302587.6096
[9]93.5089111.9364
>t.test(dane,mu=9)
OneSamplet-test
data:dane
t=6.6664,df=9,p-value=9.2e-05
alternativehypothesis:truemeanisnotequalto9
95percentconfidenceinterval:
9.7399410.50006
sampleestimates:
meanofx
10.12
>length(dane)
[1]10
Jakwida¢,niejesttotakiestraszne.Funkcja c() ł¡czypodaneargumentywwektor.Zapisujemy
gowzmiennej dane 1 .List¦wszystkichzmiennychprzechowywanychw±rodowiskuuzyskuje
si¦poleceniem ls() .Nautworzonejzmiennejmo»emywykonywa¢dalszeoperacje.Poobliczeniu
1 DoniedawnawRnieistniałoperatorrówno±ci,za±przypisaniadokonywałosi¦poprzezstrzałk¦składaj¡c¡si¦
5
99715613.001.png
Zgłoś jeśli naruszono regulamin