jump to navigation

BeeSeek – Chiacchierata con Jak sul nostro canale! venerdì 16 novembre 2007

Posted by lele85 in BeeSeek, Gestione Metadati, Google, Internet, Interviste, Notizie fresche, Protocolli di rete, Software libero.
trackback

beseek logo

Oggi pomeriggio abbiamo avuto l’opportunità di conoscere attraverso una lunga chiacchierata Jak, il manteiner del blog del progetto BeeSeek. Le domande sono state fatte in ordine sparso da lele85 (io :,P), Aktarus78, Wing_Zero e bugcontrol. Ecco una sintesi/riadattamento di tutto quello che è stato detto:

  • Che cosa è BeeSeek?

    BeeSeek nasce dalla fervida mente di Simone Brunozzi aka ubuntista. L’idea è quella di creare un motore di ricerca open-source e quindi basato su questa filosofia.

  • Cosa significa in questo caso opensource?

    Significa trasparenza totale. I motori di ricerca nell’attuale periodo storico sono alla base del sistema di comunicazione veicolando la maggior parte della navigazione nella rete. Diventa quindi necessario uno strumento che garantisca trasparenza. Ma questa da sola non basta, infatti è necessario che l’indicizzazione avvenga non a parte di uno spider ( come fa google) ma sia il più possibile “umanizzata”.

  • Quindi la componente umana sarà centrale in BeeSeek…

    Certamente! In pratica verrano considerate alcune variabili come per esempio il fatto che se dopo una ricerca con il search engine
    il primo risultato verrà cliccato ma se si ritornerà alla pagina della ricerca dopo pochissimo tempo in favore magari del secondo risultato della ricerca. Se su questo sito si rimarrà di più probabilmente significherà che è in relazione maggiore con la parola cercata. Ovviamente bisognerà prevenire i falsi positivi, un esempio banale è quello di accedere ad un sito poi rispondere magari al telefono e lasciare il browser su una determinata pagina 30 min senza usare il pc. In questi casi entrano in gioco fattori come per esempio il movimento del mouse.

  • Essere un motore di ricerca opensource potrebbe portare a degli svantaggi? Ad esempio un ipotetico webmaster , conoscendo gli algoritmi di ricerca, non potrebbe ottimizzare il proprio sito ad HOC per il motore di ricerca, SENZA che ci sia una pertinenza con l’argomento della ricerca?

    Se l’indicizzazione è “umanizzata” come dicevo prima, come potresti migliorare il tuo sito a livello tecnico? Il concetto di base è l’autoregolamentazione. Sui grandi numeri, come quelli che attraversano un motore di ricerca, per far salire un sito devi fare in modo che la gente ci si fermi o trovi notizie interessanti. Poichè è su quei parametri che BeeSekk agisce.

  • Però a livello pratico magari bisogna vedere quanto possa essere efficente l’ “umanizzazione”, questa funziona bene solo se l’utente medio è competente…Perchè l’idea di basare un motore di ricerca, piu’ sulle preferenze delle persone, che sui dati oggettivi, ho paura che possa essere fuorviante…

    Ecco un esempio, se io e te cercando un argomento X ci aspettiamo cose diverse, BeeSeek darà come prima risposta quello che la maggior parte della gente vuole, quindi probabilmente accontenterà con la prima risposta una grossa fetta di utenza! Non sono convinto, personalmente, che uno spider (considerato oggettivo) possa darmi un risultato che invece vada bene a tutti e due!

  • Dove metterete i dati dell’indicizzazione di tutta internet?

    Google ha risolto il problema coprandosi circa 450.000 computer ma a noi hanno rubato il portafoglio mentre li stavamo andando a comprare e quindi ci siamo dovuti inventare un altro metodo😛 !
    BeeSeek vuole essere basato su di una rete p2p, ovvero una decentralizzazione anche del DB con una frammentazione dello stesso tra i vari utenti che decideranno di ospitarne un pezzettino sul proprio hard disk.

    database distribuito beeseek

    Schema concettuale del database decentralizzato (autore: Andrea BS).

    Questo permetterà da un lato di non avere un DB centralizzato e dall’altro di di garantire in ogni caso la costante accessibilità ad esso. Inoltre non essendo criptato il DB occupa relativamente poco spazio! La possibilità di fare da “server” è naturalmente limitata ai soli volontari in modo di consentire ai meno esperti di non doversi occupare di ospitare il DB sul proprio pc, configurado le porte del router per esempio.

  • Ma un database non criptato nei client non potrebbe essere manomesso?

    No, per il semplice fatto che la stessa parte di DB è contemporaneamente distribuito su più PC garantendo il fatto che sia altamente improbabile che diversi utenti ospitanti il DB abbiano la stessa manomissione. Questa ridondanza serve anche perchè nel momento in cui uno spegne il proprio computer non ci può essere un buco nella ricerca.

  • Quando potremo testare con mano il lavoro finora svolto?

    Il software è praticamente testabile. Entro brevissimo, forse in giornata uscirà l’annuncio ufficiale sui blog (vedi alla fine dell’articolo per i link).

Detto questi ci siamo salutati, abbiamo fatto i complimenti e gli auguri per una sana e forte crescita di questo fantastico progetto e il buon Jak ci ha lasciato tutti gli indirizzi utili per rimanere sintonizzati sulle frequenze di BeeSeek.

Sito ufficiale: www.beeseek.org
Per info sulla community di BeeSeek: http://wiki.beeseek.org/Community
Blog: http://blog.beeseek.org
Blog (italiano): http://blog.beeseek.org/it

Ribadendo il fatto che aspettiamo Jak e tutti gli altri membri del progetto BeeSeek per qualsiasi notizia riguardante, ma anche e soprattutto per sparare 2 cavolate in compagnia! :P) nel nostro canale chiudo l’articolo.

Commenti»

1. psychomantum - venerdì 16 novembre 2007

è un progetto geniale..

2. Andrea Colangelo - sabato 17 novembre 2007

Sono il Community Manager di BeeSeek.org. Sono stato contento (e sorpreso) di vedere questo post, e ci tengo a sottolineare che *chiunque* è benvenuto a partecipare attivamente al nostro progetto. Ci sono molte posizioni sulle quali lavorare e che non richiedono necessariamente delle competenze strettamente tecniche.
We are not evil…🙂

3. lele85 - sabato 17 novembre 2007

Il progetto l’ho visto nascere dal blog e dal forum di Simone… credo che sia un progetto ambizioso e importante e che meriti spazio e visibilità!😉

4. Jak - BeeSeek blog admin - sabato 17 novembre 2007

…venghino signori, che qui c’è il vino buono…😛

5. Wing_Zero - sabato 17 novembre 2007

non vedo l’ora di fare un altra chiacchierata come quella di ieri ^^

6. JaK-oO intervistato at JaK-oO - sabato 17 novembre 2007

[…] Ho cercato di esprimere al meglio :p ciò che è BeeSeek spiegando gli obbiettivi e le motivazioni che portano avanti la realizzazione di questo motore di ricerca…per non togliervi nessuna sorpresa vi rimando direttamente al loro post. […]

7. Aktarus78 - lunedì 19 novembre 2007

Io ho fatto domande? non ricordo…
Beh comunque grazie per la citazione😀

8. churli - giovedì 22 novembre 2007

Ho appena dato un occhio a beeseek.org e ho fatto una ricerca a caso: perchè nel risultato mi dice “Google custom search” e la scheda del browser dice “blablabla Cerca con google”?
Non ho capito se questo motore di ricerca lavora in proprio o si basa in qualche modo su google…

9. Senza connessione non si fa nulla « ChurLinux* - lunedì 26 novembre 2007

[…] BeeSeek.org: un motore di ricerca “open”, trovate alcune info in questo post. Da tenere […]

10. Attacco all’alveare!!! « LinCom - lunedì 26 novembre 2007

[…] giunta notizia di un vile attacco all’alveare più famoso del web! Sembra che l’attacco sia stato fatto da 200 persone contemporaneamente… fortunatamente […]

11. BeeSeek « il blog di malaerba - lunedì 10 dicembre 2007

[…] un articolo di lele85, sotto questa licenza. Google non mi sta simpatico, e proprio per questo se Simone […]

12. DnaX - lunedì 10 dicembre 2007

@ churli: Per ora e per un po’ di tempo è necessario basarsi su una buona base dati, trascorso un po’ di tempo, una volta che raggiungeremo un certo quantitativo di informazioni ci “staccheremo” da Google. Il problema è che fare un crawler tutto nostro è parecchio dispendioso, e comunque tendiamo a dare i risultati in base ai parametri “umani” invece che affidarsi alle vecchie keywords e roba simile…


Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger cliccano Mi Piace per questo: