Потребителски вход

Запомни ме | Регистрация
Постинг
12.12.2007 17:54 - Diri.bg - излагация от Dir.bg?
Автор: inet Категория: Технологии   
Прочетен: 17741 Коментари: 12 Гласове:
0

Последна промяна: 12.12.2007 19:24

Постингът е бил сред най-популярни в категория в Blog.bg
От доста време насам съм твърдо ЗА българските търсачки. Следя отблизо Jabse почти от самото й създаване* и въпреки, че има още доста какво да се иска от нея, проекта, движен от един единствен човек, се справя отлично и няма кой знае какви претенции**. Няма как да подмина на този фон пускането на Diri.bg, проект на Dir.bg. И то не толкова заради качествата на самата търсачка, а заради претенциите, с които се пуска.

Да видим първо как самите те представят услугата си днес, на първа страница на сайта си:

"Нова търсачка www.diri.bg от днес дири в цялото българско интернет пространство. Амбициите на мащабния проект са да дава бързи и адекватни резултати на българския интернет потребител. Около 15% българи, които по една или друга причина търсят на латиница, ще получават резултати не само при съответствие на думата на латиница, но и на нейния еквивалент на кирилица. Към момента дири.бг търси в 50 милиона документа. Възможностите за обновяване на някои сектори като новини, обяви, форуми са в рамките на всеки половин час. 

Проектът дири.бг е реализиран в съдействие с руски програмисти, като така се ползва опита на един от малкото пазари, успешно противодействащи на Google. Дири включва разнообразие от специализирани търсения в български и международни новини, картинки, видеоматериали, обяви за имоти, автомобили, работа и др. Акцент е търсенето в българската част на интернет енциклопедията - Wikipedia. Съвременният дизайн на www.diri.bg улеснява търсенията с интуитивен помощник. Специални административни грижи се полагат за чистотота на резултатите така, че те да са подходящи за всички възрасти."

Приятно изненадан от новината влизам да тествам въпросната Дири.бг. Пускам търсене за "блог", "blog" и още 5-6 думи на кирилица и латиница - нито един резултат?!?

image
 
За сметка на това получих отстрани блокче с напълно несвързани новини и снимки:

image

Интересно, но половин час по-късно вече имаше резултати по тези думи, както и по останалите, за които търсих. Ремонти в последните минути? Както и да е, продължих смело напред, за да открия редица крайно необмислени неща, както и резултати, показващи по-скоро търсене в Dir.bg, отколкото във "цялото българско интернет пространство".
Например обръщането на думите на латиница към кирилица. В някои случаи това е ОК, в доста други - не. Обратното обръщане, което се прави, обаче е отвратително. При търсене за "Вила" в "Кино", например, излизат всякакви резултати за "Vila", което няма нищо общо с това, което търся. Дори и да бяха свързани с търсенето ми, защо в българска търсачка като напиша дума на кирилица виждам най-отгоре резултати за таранслитерираната дума на латиница - резултати от сайтове на английски език.

Логиката на подреждане на резултатите е меко казано лоша, неясна и нефункционална. При търсене за "Титаник" в "Кино", например, ми излизат най-отгоре резултати от imdb.com, свързани и несвързани с Titanik. За щастие знам английски, така че мога да се оправя и с тези резултати, но какво да кажат хората, които си мислят, че ползват българска търсачка? Ако трябва да сме точни, всички резултати до номер 106 включително са от един единствен сайт - imdb.com. Едва след това, чак на 11-та страница, започват български резултати от... kino.dir.bg. В края виждаме и 4-5 резултата от mininova.org. Крайно беден подбор от сайтове-източници на съдържание, а групирането на резултите едва ли може да е по-лошо.

В повечето категории изглежда положението е същото. "GSM" търсенето включва само резултати от Handy.bg и GSMarena.com,  за "имоти" - Imot.bg и Imoti.net. Търсачките под табове "Право", "Форуми", "Стоки", "Музика", "Картинки" показват, че според тях информация от изброените типове има само в техния сайт - Dir.bg. Или може би "цялото българско интернет пространство" от статията е всъщност Dir.bg?

Все пак при "Работа" има някакво разнообразие - Rabota.bg, Jobs.bg, JobTiger.bg, Neogen.bg, MyCV.bg, а също при блоговете - Blog.bg, Glog.dir.bg, Blogspot.com, Wordpress.com и при видео клиповете - video.google.com, YouTube.com, Vbox7.com, Video.dir.bg, но определено не е достатъчно. В новини имаме Dnes.bg, Standartnews.com, Actualno.com, Novini.dir.bg, Lenta.ru (?), Rbc.ru (?), Dnevnik.bg. Групирането и подреждането на резултатите абсолютно навсякъде е еднакво отвратително.

Интересно, при търсене в мрежата за "блог" или "blog" всичките 100 страници с резултати са с резултати от Blog.bg :-) Blog.bg може да е най-големят в България, но нито е единствен, нито е единствения източник за информация за блоговете.

Колкото до скоростта на търсене - многократни тестове с търсене за "mp3" в Diri.bg показа скорост на намиране на резултата от 0.50 до 4.00 секунди, а скоростта на показване беше дори по-бавна. За сравнение, същото търсене в Google се зарежда за 0.05-0.11 секунди и страницата се зарежда мигновено.

"Възможностите за обновяване на някои сектори като новини, обяви, форуми са в рамките на всеки половин час" - при положение, че новините, обявите и форумите се теглят само от вашия сайт, защо не ги давате в реално време, а трябва да чакам половин час?

Поддръжката на допълнителни команди и опции за търсене, като тези, с които сме свикнали да ползваме в Google, Yahoo или MSN изобщо липсва. Не се виждат никъде условия за ползване на услугата, информация за уеб краулера им, спецификации, поддръжка на robots.txt и други критични неща. Комуникация с уебмастърите, които реално правят търсачката им възможна равна на нула. Като казах Robots.txt, самите Diri.bg нямат такъв файл, нито мета тагове, забраняващи индексирането им, което означава, че ще оставят други търсачки да индексират страниците им с резултати - абсолютно противоречие със световната практика.

Не знам какви руски специалсти са работили по diri.bg. Ако обаче с "опита на един от малкото пазари, успешно противодействащи на Google" намекват за Yandex и Rambler, едни наистина добри търсачки, то явно са сбъркали специалистите, тъй като Diri.bg е на светлинни години от тях, поне по това, което виждаме дотук (backend-а може и да е страхотен, но важното е какво доставяш на потребителите).

Като човек, който последните няколко години е прекарал ежедневно с интернет търсачките, не мога да намеря по-добро мнение за пускането на Diri.bg от излагация. Особено на фона на много по-непретенциозния и разполагащ с много по-малки ресурси Jabse. А вие?


* Мои материали за Jabse:
Българската търсачка Jabse - ревю
Jabse.com - българската търсачка, продължава да се развива
Jabse вече намира и изображения
New Bulgarian Search Engine Gaining Visibility
Global Search Report 2007

** Jabse = Just Another Bulgarian Search Engine

*** Получи се наистина дълго, сега като го гледам, ама какво да го правиш, страст...


Тагове:   BG,


Гласувай:
0



Спечели и ти от своя блог!
1. анонимен - прав си, но..
12.12.2007 21:47
Здравей! Проверих забележките ти и се оказа, че си прав за всички. Да се надяваме, че ще поработят по подобряването на кода и ще се сътвори нещо наистина ценно. Но до тогава може да почакаме и времето ще покаже дали си е струвало чакането :)
цитирай
2. inet - Да
12.12.2007 21:57
има надежда да се оправи, ако направят необходимите усилия. За всички ще е добре да има повече конкуренция в сферата и Google да не е пълен монополист.
цитирай
3. morkovche1 - Привет! И аз бързах, да я ведя тая ...
12.12.2007 22:57
Привет! И аз бързах, да я ведя тая нова търсачка и останах разочарована.
цитирай
4. monnio - :)
13.12.2007 00:08
доста по изчерпателен си от мен по темата. не бях прочел материала ти.
поздрави
цитирай
5. анонимен - DIRI ama nisto ne diri...
13.12.2007 01:49
Kato vidiah statiata v dir.bg za diri.bg mi napravi dosta nepriatno vpechatlenie tiahnoto tvyrdenie che te, razbirash li, bili napravili pyrvata BG tyrsachka. Bylgarskata tyrsachka syshtestvuva imeto i e JABSE. Syzdadena e ot edin chovek (bylgarin, ne rusnak). Osven tova gospodata ot DIRI.BG tvyrdiat che tyrsiat v 50 MLN documenti. Vseki koito se e zanimaval malko s materiata znae kakvo znachat 50 MLN documenta.
I posledno kogato se opitah da napisa komentar che vsyshtnost Jabse e pryvata BG tyrsachka komentara prosto bese iztrit ot dir.bg.

taka che, gospoda ot DIRI.BG (dir.bg) ima da rabotite dosta, nai - malkoto za da dostignete vyzpitanieto na jabse.com

vseki moje da kopira wikipedia...
цитирай
6. анонимен - Вертикално търсене в България
15.12.2007 10:59
Казвам се Атанас Марков и участвам в разработката на друга българска систима за вертикално търсене пусната даже преди diri.bg - http://www.imoten.com е първият продукт с платформата, като скоро се надяваме да имаме време за видео, новини и т.н. Двама души сме. Все си викам, че dir.bg с ресурсите си и много време за разработка можеше да покажат смислено вертикално търсене, а не само текстови резултати. Нашият продукт си търси данните в БД със структура точно за типа им и е много по-удобен.
цитирай
7. анонимен - Diri.bg Beta :)
15.12.2007 12:13

Услугата е добра за бета версия :)
цитирай
8. анонимен - маркетингова грешка
19.12.2007 15:45
Екипа на diri.bg допусна голяма маркетингова грешка, като пусна diri.bg под шапката на dir.bg
цитирай
9. анонимен - Global Search Report
19.12.2007 16:00
Георги здравей,

видях че си участвал в Global Search Report 2007 и в много скромни 10 реда си описал БГ търсачките.

Изключително неточни данни си дал! Надявам се имаш предвид, че в България огромна част от хората ползват търсенето на Dir.bg и на Gbg.bg - общо над 300.000 търсения на ден.

За сравнение - Google Имат над 1 милион търсения на ден, Jabse.com - около 10.000 на ден.

По принцип, не е добре да се подхожда с песимизъм и критичност към български проекти (макар и писани от руски програмисти). Малко повече толерантност и разбиране към усилията на тези хора. Все пак нищо не става от раз.
Аз лично не бих отворил Google за БГ ако разполагам с адекватна алтернатива. Успех на Diri.bg!
цитирай
10. inet - @анонимен
23.12.2007 16:08
Dir.bg и Gbg.bg не са истински търсачки, а директории. Доколкото gbg.bg има функционалност на истинска търсачка, то тя се изпълнява от енжина на Google.

Мисля, че съм първия който обърна по-сериозно внимание на Jabse, посочвайки добри и не толкова добре реализирани неща в поредица от постинги. Изобщо не подхождам с песизизъм, мисля, че съм абсолютен реалист. Ако имаш доводи против това, давай...
цитирай
11. анонимен - Търсачките, ех търсачките
28.12.2007 00:27
dir.bg беше директория в първоначалния си замисъл, но в нея напоследък има доста голям брой страници, класиране, търсене за картинки, видео и други материали, дори реклами. Затова би могло да се каже че има доста от качествата на една търсачка. Освен това хората в БГ активно ползват Dir.bg за търсене... е какво по-добро определение за една търсачка ;)

За Gbg.bg е ясно, че енжина е на Google, но това не намалява пазарния и дял от около 20% в общия брой търсения В България. А колко от хората, които ползват Гювеча за търсене знаят, че резултатите са от Google? Вярвай ми, много малка част подозират какво им се предоставя.

За Jabse.com - много време си отделил да анализираш търсачка, която няма нито пазарен дял, нито добър енжин. Засега е просто един опитен проект

Идеята ми е, че ако искаш да анализираш пазарната ситуация, прави го цялостно и задълбочено, включвайки всички играчи и алтернативи, проведи подробно изследване, запознай се с точните цифви, дори се срещни с авторите на тези проекти.

Ако искаш да сравниш енжините на търсачките, и механизмите за търене и класиране - откажи се, освен Google никой няма скоро да предложи атернатива в БГ. Поне 5 години труд на опитен екип стои зад всяка сериозна търсачка
цитирай
12. анонимен - ....
30.12.2007 00:18
dir-a са жалки аматьори, щеше да е изненада, ако бяха направили нещо стойностно..
цитирай
Вашето мнение
За да оставите коментар, моля влезте с вашето потребителско име и парола.
Търсене

За този блог
Автор: inet
Категория: Технологии
Прочетен: 1946670
Постинги: 259
Коментари: 660
Гласове: 1285
Календар
«  Февруари, 2023  
ПВСЧПСН
12345
6789101112
13141516171819
20212223242526
2728