Język programowania R, obok Python, jest obecnie najpopularniejszym sposobem analizy danych tabelarycznych. Dane takie mogą pochodzić z prac wykopaliskowych, kwerend i różnych opracowań. Zastosowanie wbudowanych narzędzi w R pozwala daleko wykroczyć poza możliwości MS Excel, czy nawet komercyjnych programów statystycznych. Sprawia to, że w archeologii światowej R stał się bardzo rozpowszechnionym narzędziem. Od kilku lat w CAA International powstała specjalna grupa zainteresowań Scientific Scripting Languages in Archaeology (SIG-SSLA), która zajmuje się dydaktyką i tworzeniem nowych narzędzi dla archeologów.
Czy R warto się nauczyć? Jakie są jego możliwości? Na czym to polega?
Odpowiedź jest jednoznaczna. Warto, a nawet trzeba. Język R jest tworzony przez The R Foundation for Statistical Computing, czyli organizację skupiającą się na tworzeniu narzędzi dla obliczeń statystycznych. Narzędzia w R są pogrupowane w biblioteki specjalnie dedykowane dla danego zagadnienia. Są też zbiory narzędzi stworzone specjalnie dla analiz GIS, wizualizacji 3D, modelowania agentowego, uczenia maszynowego, i wielu innych. Lista narzędzi jest bardzo długa. Obecnie powstało przynajmniej 15 zestawów narzędzi dla samej archeologii. Można wprost powiedzieć, że jeśli natrafiliście na jakieś trudne obliczenia statystyczne i matematyczne w jakimś artykule, to jest duża szansa, że zrobicie to w R przy pomocy jednego polecenia.
Gdzie można znaleźć informacje o R potrzebne dla archeologa?
Samouczek języka R dla archeologów, dzięki czemu znajdziecie wszystko, co trzeba wiedzieć na start.
Zespół badaczy stworzony w obrębie CAA International, który zajmuje się dydaktyką i tworzeniem nowych metod analiz dla archeologów.
Celem Data Carpentry jest nauczenie naukowców podstawowych pojęć, umiejętności i narzędzi do pracy z danymi, tak aby mogli zrobić więcej w krótszym czasie i z mniejszym bólem. Poniższe lekcje zostały opracowane z myślą o osobach zainteresowanych pracą z danymi z zakresu nauk społecznych w języku R.
Jest to wprowadzenie do języka R przeznaczone dla uczestników bez doświadczenia w programowaniu. Lekcje te mogą być przeprowadzone w ciągu jednego dnia (ok. 6 godzin). Zaczynają się od podstawowych informacji o składni języka R, interfejsu RStudio i przechodzą przez import plików CSV, strukturę ramek danych, postępowanie z czynnikami, dodawanie/usuwanie wierszy i kolumn, obliczanie statystyk zbiorczych z ramek danych oraz krótkie wprowadzenie do tworzenia wykresów.
Lekcja pokazująca jak analizować dane i je wizualizować
Warsztaty podczas konferencji CAA – Forum GIS UW
Od czego zacząć naukę?
Do nauki powstało wiele książek, ale warto zacząć od czegoś prostszego – na przykład wideo instruktaży dostępnych na platformie Udemy, czy nawet YouTube. Poniżej prezentujemy kilka wstępnych lekcji