R_preprocess

2645 days ago by aniag

Zadanie 1 \noindent Wczytaj (uzywajac funkcji {\tt read.delim()}) znajdujace sie pod adresem \\ {\tt http://faculty.ucr.edu/\~ \ tgirke/Documents/R\_BioCond/Samples} tabele \\ {\tt MolecularWeight\_tair7.xls} (dane dotycza molekularnej masy i skladu aminokwasowego bialek {\it Arabidopsis thaliana}) oraz \\ {\tt TargetP\_analysis\_tair7.xls} (dane o przewidywanej lokalizacji wewnatrzkomorkowej tych bialek -- poczytaj wiecej na: {\tt http://en.wikipedia.org/wiki/Signal\_peptide}). \begin{enumerate} \item Zmien nazwe kolumny identyfikujacej geny na taka sama w obydwu tabelach. \item uzywajac funkcji {\tt merge()} polacz obydwie tabele w jedna. \item wyeliminuj wiersze nie majace odpowiednika w drugiej tabeli, czyli te ktore zawieraja {\tt NA} (mozesz uzyc funkcji {\tt na.omit() }). \item znajdz wszystkie geny, ktorych molekularna waga przekracza 100 000 Daltonow, oraz podejrzewa sie je o przebywanie w chloroplastach. \item dla kazdego bialka policz srednia wage aminokwasu w tym bialku -- dolacz te informacje do tabeli uzywajac funkcji {\tt data.frame()} \item uzywajac funkcji {\tt apply()} policz dla kazdego bialka odchylenie standardowe dla wektora wag przewidujacych peptydy sygnalowe-- dolacz te informacje do tabeli uzywajac funkcji {\tt data.frame()}. \item zapisz stworzona w krokach 1-6 tabele do pliku typu .xls (uzyj funkcji: {\tt write.table(... sep="\t"...)} \end{enumerate} 
       
Zadanie 2 \noindent Dla danych z poprzedniego zadania: \begin{enumerate} \item Zilustruj na rysunku typu "boxplot" dane dotyczace molekularnej masy i liczby aminokwasow w rozwazanych bialkach (zapisz dane do pliku typu .pdf: pdf("box\_plot.pdf")). \item narysu wykres gestosci dla molekularnej masy w badanych bialkach -- zapisz rysunek w formacie .pdf. \item obejrzyj skrypt rysujacy diagram Venn'a: \\ {\tt http://faculty.ucr.edu/\~ \ tgirke/Documents/R\_BioCond/My\_R\_Scripts/overLapper.R} \item zaimportuj go uzywajac funkcji {\tt source()} i zilustruj przeciecia dla 3 wylosowanych zbiorow genow licznosci 100. Geny losujemy z uzyciem funkcji {\tt sample()}. \item powtorz krok 4 dla 3 zbiorow licznosci 1000 oraz 5 zbiorow licznosci 5000. Zapisz otrzymane rysunki w formacie .pdf. \end{enumerate}