Adobe Work & Play – DEV 2 Problema 5
Posted by civascu on mai 28, 2011
Filed Under Adobiști, Echipa, Educație, Evenimente, Muncă | 8 Comments
Tema:
Construiți un web crawler (http://en.wikipedia.org/wiki/Web_crawler) care, pornind de la unul sau mai multe bloguri de pe blogspot.com construiește o listă cu cele mai populare 10 bloguri. Popularitatea unui blog este determinata de numărul de bloguri ce îl au trecut pe lista de favorites.
Aveți completă libertate în alegerea limbajului de programare și a bibliotecilor folosite.
Barem:
- 6p. Readme/ API/biblioteci + comentarii alegere/ folosirea API-ului/bibliotecilor (cel puțin un request funcțional);
- 4p. Funcționalitatea problemei;
- +/- 1p Coding style;
- Punctajul este intre 0-10.
Update: Aceasta e o problemă open-question, fiecare rezolvare poate fi “bună” și deci nu există soluția perfectă.
Comments
8 Responses to “Adobe Work & Play – DEV 2 Problema 5”
Leave a Reply


1. M-am uitat pe bloguri si nu exista explicit o categorie unde mentioneaza favourites. Este ok daca “Popularitatea unui blog este determinata de numărul de bloguri ce au un link catre el?”.
2. Cat de mult sa lasam crawler-ul sa itereze , sau aceasta ramane la latitudinea noastra?
catalin: numarul de links catre un blog e ok. Numarul de iteratii ar fi frumos daca il putem da noi – ne intereseaza mai mult abordarea problemei
Biblioteci
Mulțam, astea le scăpaserăm
Buna dimineata,
Crawler-ului meu ii trebuie cam 10 minute pentru a parcurge 10000 de pagini.(poate este si de la conexiunea mea, netul e destul de slab si am si doar 2 linii la wireless
). E in regula daca setez limita la 500 de pagini si va trimit un print screen cu un top semnificativ?
Sunt puncte in plus pentru interfata, folosire Ajax, etc, sau un simplu Submit Button e suficient ?
MuLtumesc !
@jungle
Buna dimineata,
E configurabil numarul de iteratii?
Trimite-ne toate sursele si makefile-urile, asa putem sa le compilam, rulam si corectam/intelegem.
O interfata frumoasa cu utilizatorul aduce puncte in plus si e intotdeauna binevenita. Sa nu uitam ca Adobe face cele mai bune unelte pentru “creative professionals”
Multumim!
La mine in top mereu sunt site-urile google (googleblog, googlecode….) trebuie sa le exclud sau nu?
conform enuntului trebuie sa afisezi cele mai populare 10 bloguri.deci ar trebui sa filtrezi dupa url-uri de genul *.blogspot.com