Adobe Work & Play – DEV 2 Problema 5

Posted by civascu on mai 28, 2011
Filed Under Adobiști, Echipa, Educație, Evenimente, Muncă | 8 Comments

Tema:

Construiți un web crawler (http://en.wikipedia.org/wiki/Web_crawler) care, pornind de la unul sau mai multe bloguri de pe blogspot.com construiește o listă cu cele mai populare 10 bloguri. Popularitatea unui blog este determinata de numărul de bloguri ce îl au trecut pe lista de favorites.

Aveți completă libertate în alegerea limbajului de programare și a bibliotecilor folosite.

Barem:

Update: Aceasta e o problemă open-question, fiecare rezolvare poate fi “bună” și deci nu există soluția perfectă.

Share

Comments

8 Responses to “Adobe Work & Play – DEV 2 Problema 5”

  1. Dobre Catalin on mai 28th, 2011 10:40

    1. M-am uitat pe bloguri si nu exista explicit o categorie unde mentioneaza favourites. Este ok daca “Popularitatea unui blog este determinata de numărul de bloguri ce au un link catre el?”.

    2. Cat de mult sa lasam crawler-ul sa itereze , sau aceasta ramane la latitudinea noastra?

  2. civascu on mai 28th, 2011 10:50

    catalin: numarul de links catre un blog e ok. Numarul de iteratii ar fi frumos daca il putem da noi – ne intereseaza mai mult abordarea problemei

  3. Stefan on mai 28th, 2011 13:55

    Biblioteci :P

  4. donac on mai 28th, 2011 16:17

    Mulțam, astea le scăpaserăm :)

  5. junglesnail on mai 29th, 2011 07:22

    Buna dimineata,

    Crawler-ului meu ii trebuie cam 10 minute pentru a parcurge 10000 de pagini.(poate este si de la conexiunea mea, netul e destul de slab si am si doar 2 linii la wireless :) ). E in regula daca setez limita la 500 de pagini si va trimit un print screen cu un top semnificativ?
    Sunt puncte in plus pentru interfata, folosire Ajax, etc, sau un simplu Submit Button e suficient ?

    MuLtumesc !

  6. donac on mai 29th, 2011 08:53

    @jungle
    Buna dimineata,

    E configurabil numarul de iteratii?

    Trimite-ne toate sursele si makefile-urile, asa putem sa le compilam, rulam si corectam/intelegem.

    O interfata frumoasa cu utilizatorul aduce puncte in plus si e intotdeauna binevenita. Sa nu uitam ca Adobe face cele mai bune unelte pentru “creative professionals” :)

    Multumim!

  7. Mihai on mai 29th, 2011 13:58

    La mine in top mereu sunt site-urile google (googleblog, googlecode….) trebuie sa le exclud sau nu?

  8. ralecsan on mai 29th, 2011 14:03

    conform enuntului trebuie sa afisezi cele mai populare 10 bloguri.deci ar trebui sa filtrezi dupa url-uri de genul *.blogspot.com

Leave a Reply