DictionaryForumContacts

 varism

link 10.02.2006 17:09 
Subject: OFF Статистика форума
Информация к размышлению.

Всего на 17:00 10.02.2006 г - в форуме зарегистрировано 46411 вопросов на 1548 страницах.
При этом:

............Период...............Количество.......Рост
..........................................вопросов

04.05.2001-31.12.2001............19..............-
01.01.2002-31.12.2002..........243..........1279%
01.01.2003-31.12.2003........1657............682%
01.01.2004-31.12.2004........9475............572%
01.01.2005-31.12.2005......30669............324%
01.01.2006-10.02.2006........4348...............-

При данных темпах количество вопросов может достигнуть:

- за 2006 г. - 49000 (в форуме будет всего страниц ~3180, вопросов ~95400)
- за 2007 г. - 78000 (в форуме будет всего страниц ~5780, вопросов ~173400)

Можно ли будет говорить о какой-либо реорганизации форума в конце 2007 года при 175 тыс. вопросах?
Это большой ?

 Brains

link 10.02.2006 17:12 
Это точно. Особенно если учесть в расчётах также и то, как сайт в целом работает днём.

 alk moderator

link 10.02.2006 17:46 
Надо график построить. Тогда будет видно, когда же Земля налетит на небесную ось.

 varism

link 10.02.2006 18:06 
2alk
Подобные комментарии неуместны. Я привел эти цифры не для упражнений в острословии. Надо смотреть на вещи реально, а не из соображений "нравиться, не нравиться, традиции" и т.п. Не может форум бесконечно нормально существовать при линейной структуре. Этот вопрос запоздал, по крайней, мере на год.

 SH2

link 10.02.2006 18:22 
Да ну, 100 тысяч тем — не цифра.

 varism

link 10.02.2006 18:49 
2SH2
Ну да. Для бешенной собаки - 10 верст не крюк. Речь идет в возможности систематизации. Вы возьметесь систематизировать всего-лишь:))) 100 тысяч тем?

 Annaa

link 10.02.2006 19:01 
Вопрос: надо ли их систематизировать?

 varism

link 10.02.2006 19:11 
Или надо систематизироваить, или "обрубать" начальные периоды форума. При таком объеме "навалом" ни фильтры, ни поиск не помогут.

 alk moderator

link 10.02.2006 23:15 
varism - У Вас не очень современный подход к теме. Поисковые машины давно ничего не ограничивают, индексируют только. Форум, как и любой другая мультитрановская база, это прежде всего индекс. Индексу наплевать сколько их там было, этих самых тем, хоть сто тысяч миллионов, главное их умело и безошибочно индексировать, на что нужна отработанная технология, интеллектуальный алгоритм и мощные компьютеры. За примером далеко ходить не надо - старик Гугл со своими проиндексированными восьмью миллиардами страниц и скоростью реакции на запрос, как у кошки. Алгоритмы ранжирования страниц - это конечно главное, что помогает прекратить думать о раскладывании по полочкам самой информации, достаточно раскладывать только хитрым образом подготовленные слепки с нее, те самые пресловутые индексы.
Тот же самый принцип реализован сегодня в "настольных" поисковых системах, том же Google Desktop или Windows Desktop Search, последний будет целиком внедрен в Windows Vista. Так что все в порядке, почти как в яндексе, найдется не просто всё, а то, что нужно.

 varism

link 11.02.2006 8:34 
2alk

Я вообще то говорю о другом. Речь не идет о применении внешних поисковиков. В настоящий момент основная масса пользователей их не использует (что говорить о них, если много людей, которые не знают как работать с имеющимися в Инте системами, к сожалению, компьютерная грамотность большинства в России все еще находится на уровни печати текстов в Word и игр), а у многих ресурсы компов не позволяют их использовать.
Речь о необходимости определенной модернизации самого форума. Ведь в настоящее время огромный пятилетний труд сотен людей тянется бесполезным шлейфом в форуме, и этот богатейший материал невозможно толком применить. Я просто считаю, что необходим какой-то внутренний механизм (неважно в какой форме он будет, главное, чтобы он был достаточно простым), с помощью которого любой пользователь, независимо от того, чайник он или профи, от конфигурации компьютера, способа связи, мог бы быстро найти необходимую информацию.
Это рассуждение конечно верно только в том случае, что форум создан в интересах и ради аскеров, а не… (не буду продолжать, а то снова вызову шквал недовольства).

 alk moderator

link 11.02.2006 9:39 
Форум создан как средство помощи переводчиков друг другу, а затем и собственно еще одним словарем, если так можно выразиться. Пока что им трудно воспользоваться как словарем из-за неразвитости поиска по форуму, но это будет сделано, поскольку серьезных трудностей в прикручивании механизма расширенного поиска нет.
Насчет поисковиков Вы не правы. Ими очень даже пользуются, можно сказать, что только ими и пользуются. Последние десять лет в Интернете именно поисковики доводили до ума, и довели до поразительных результатов, почти фантастическая точность Гугла в подборе первых ссылок говорит о том, что человечество вплотную приблизилось к пониманию того, как ему свойственно представлять информацию. Можно уже не заниматься каталогизацией. Вот такая аналогия приходит на ум.
Книги можно продолжать хранить на полках, строго придерживаясь только нумерации полок и номеров книг. Никаких тематических подразделений. Никакого алфавитного указателя. Текст книг надо индексировать, то есть создать таблицу слов всех книг. Книги сопоставлены по номерам. Дальше можно будет искать по любому слову или сочетанию, книга моментально будет найдена, где бы она не находилась, хоть в подвале, хоть на чердаке. Ее уже может давно уже украли, а она все еще находится по индексу.
В общем, сколько бы не было тем в форуме, если индексирование работает правильно, а тема индексируется сразу, как только сообщение в ветке сохранено, то по слову можно найти искомую ветку, сколько бы их ни было.
Никуда ценнейший материал не денется, но надо сделать расширенный поиск, и индексацию тогда проводить по большему количеству ключей.

 varism

link 11.02.2006 10:53 
2alk
Я с вами полностью согласен. Но ведь данный вопрос возник именно из-за отсутствия такового (если будет - то когда?). А то получается, что паны дерутся, а Васька слушает, да ест.

 pom moderator

link 11.02.2006 11:12 
Точнее, я ем, но слушаю :)

Помимо учёта имени пользователя и интервала дат при поиске в форуме ещё что-то нужно?

Движок форума и так уже три раза пришлось переписывать, хотелось бы точнее определиться с задачей.

 alk moderator

link 11.02.2006 11:49 
Движок нормальный, но индексы в базу надо добавить. Аккуратно, не обязательно сейчас сразу находить ВСЕ необходимые поля. Думаю, со временем появится и поле "тематика", искусственно или естественно задаваемая для каждого топика.
Комбинацию ключей тоже надо как-то оптимизировать. Не знаю, как это сейчас устроено у Васьки, который слушает :) Релевантность тоже слово важное.
Мне представляется важным оптимизировать движок поиска по форуму именно для того, чтобы помогать при поиске в словаре вообще. Сейчас поиск по форуму появляется, как последняя надежда, а для сочетания слов при поиске форум - первый друг, там обычно помогают переводить именно фразу, а не просто слово.
Слово худо бедно можно и в Гугле найти или там в answers.com с wikipedia.org
Кстати, Гугл зря времени не теряет и содержимое Мультитрана продолжает индексировать самостоятельно, правда вот до форума он еще не добрался почему-то.

 Annaa

link 11.02.2006 12:00 
Мне кажется, коль появился параметр "тематика", то надо учитывать и ее. С другой стороны, поскольку этот параметр пока факультативен, то как это сделать корректно, вероятно, надо думать. В любом случае этого поля не существовала вообще до недавнего времени. Возможно, надо сначала искать по темам, где это поле заполнено, а потом во всех остальных

 varism

link 11.02.2006 12:27 
Уважаемый Андрей Валентинович.
Хорошо было бы, если бы вы обсуждение тем, касающихся самого форума, взяли под свою эгиду. Скажем так, направлять в нужное русло и придерживать участников от заносов вправо-влево. Ведь ваши возможности известны только вам.

 pom moderator

link 11.02.2006 12:48 
Вот я иногда и встреваю в дискуссию :)
А все возможности даже мне неизвестны.

 

You need to be logged in to post in the forum