!pwd /home/sergey/grep_ !cat file.txt movieId,title,genres 1,Toy Story (1995),Adventure|Animation|Children|Comedy|Fantasy 2,Jumanji (1995),Adventure|Children|Fantasy 3,Grumpier Old Men (1995),Comedy|Romance 4,Waiting to Exhale (1995),Comedy|Drama|Romance 5,Father of the Bride Part II (1995),Comedy 6,Heat (1995),Action|Crime|Thriller 7,Sabrina (1995),Comedy|Romance 8,Tom and Huck (1995),Adventure|Children 9,Sudden Death (1995),Action Count number of occurencies of «|» 1. With AWK !awk -F «|» ‘{print(NR, NF-1)}’ file.txt 1 0 2 4…

pwd() ‘/home/sergey/myvagrant’ Spark позволяет обрабатывать большие объемы рапределенных данных, которые хранятся в RAM на Hadoop фермах. В данном примере я покажу, каким образом можно применить данную технологию для подсчета частоты употребления слов в англоязычной версии «Война и Мир» Толстого. Логическим продолжением этого упражнения может быть решение таких практических задач как: recommender systems (collaborative filtering or…

© 2014 In R we trust.
Top
Follow us: