[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: генератор текста для ПМ на PHP
yuriy
Добрый день!
Не подскажите какой-нибудь скрипт на PHP для генерации удобоваримого текста для поисковика.



Спустя 2 минуты, 28 секунд (6.12.2011 - 12:47) Семён написал(а):

Спустя 38 минут, 42 секунды (6.12.2011 - 13:26) yuriy написал(а):
Есть, допустим, у меня некий генератор текста с включением в него ключевых слов. Получается микс с простым текстом с включениями '<strong>', '<a>' и '<h1>' тегов. Как оценить, вообще, скушает ли поисковик эту кашу или скажет "какая гадость ваша заливная рыба".

Спустя 1 минута, 59 секунд (6.12.2011 - 13:28) yuriy написал(а):
Не подскажите, может есть какие-то инструменты, где можно посмотреть "вкусный" ли текст для поисковика или не очень.

Спустя 21 минута, 23 секунды (6.12.2011 - 13:50) Семён написал(а):
Поисковики давно не ведутся на кашу из ключевых слов.

Спустя 21 минута, 44 секунды (6.12.2011 - 14:11) yuriy написал(а):
Ну вот и стоит у меня задача, чтобы повелись и текст был как "настоящий". Задача не очень тривиальная, да? Тем она и хороша. )

Спустя 1 минута, 26 секунд (6.12.2011 - 14:13) yuriy написал(а):
Только нужно где-то индикатор найти, по которому можно определять "вкусность" текста для поисковика. )

Спустя 35 минут, 35 секунд (6.12.2011 - 14:48) vital написал(а):

Спустя 1 минута, 29 секунд (6.12.2011 - 14:50) vital написал(а):
Цитата (yuriy @ 6.12.2011 - 13:11)
Ну вот и стоит у меня задача, чтобы повелись и текст был как "настоящий". Задача не очень тривиальная, да? Тем она и хороша. )

Ну есть много разных алгоритмов -но для большинства из них есть "контр" алгоритмы.
А те к-е работают - за спасибо на форуме вам никто не спалит.

Спустя 5 минут, 57 секунд (6.12.2011 - 14:56) yuriy написал(а):
Это точно. Такой алгоритм никто не спалит. ) Ну и на том спасибо. Уже кое-что. Будем помаленечку подбираться к такому алгоритму. Цепи Маркова, говорят, сильно помогают в этом вопросе, даже чуть ли не нейронные сети. Только вот сколько это чудо съест времени и ресурсов.

Спустя 49 секунд (6.12.2011 - 14:57) yuriy написал(а):
Времени и ресурсов веб-сервера, естественно.

Спустя 1 минута, 38 секунд (6.12.2011 - 14:58) vital написал(а):
Цитата (yuriy @ 6.12.2011 - 13:56)
Это точно. Такой алгоритм никто не спалит. ) Ну и на том спасибо. Уже кое-что. Будем помаленечку подбираться к такому алгоритму. Цепи Маркова, говорят, сильно помогают в этом вопросе, даже чуть ли не нейронные сети. Только вот сколько это чудо съест времени и ресурсов.

Цепи маркова - я вам привел на сайте vesna.yandex.ru.
Было актуально году в 2002м.
Не тратте время.

Спустя 4 минуты, 54 секунды (6.12.2011 - 15:03) yuriy написал(а):
Ну тогда тупо брать текстовку из RSS-канала, пропускать её через рандомизатор и подмешивать ключевых слов. Думаю, тоже не плохое решение.

Спустя 34 секунды (6.12.2011 - 15:04) vital написал(а):
Цитата (yuriy @ 6.12.2011 - 14:03)
Ну тогда тупо брать текстовку из RSS-канала, пропускать её через рандомизатор и подмешивать ключевых слов. Думаю, тоже не плохое решение.

Такой же боян как и цепи маркова.

Спустя 10 минут, 5 секунд (6.12.2011 - 15:14) yuriy написал(а):
А что по-вашему тогда не боян, осмелюсь спросить? )

Спустя 1 минута, 49 секунд (6.12.2011 - 15:16) yuriy написал(а):
база оконченных предложений, которые потом можно менять местами?

Спустя 4 часа, 1 минута, 3 секунды (6.12.2011 - 19:17) I++ написал(а):
Подобные алгоритмы существуют, разрабатывались на кафедре МГУ не один год, данные алгоритмы секретны, и никто Вам их не даст, а уж тем более готовое решение.

Так, что тема данного топика никогда не будет раскрыта.

В далеких 2000 годах, был кайф дорвеи плодить, трафика в месяц по 15 лямов с дора собирал.

Но раньше алгоритмы были проще, сейчас эникеем не получится )

Дам небольшую подсказочку по теме.

"Cъешь еще этих мягких французских булочек"

Cъешь = A
еще = B
этих = C
мягких = D
французских = E
булочек = F

A+B+C+D+F+E

array {
AB + WEIGHT
ABC + WEIGHT
BC + WEIGHT
BCD + WEIGHT
CD + WEIGHT
DF + WEIGHT
DFE + WEIGHT
FE + WEIGHT
}

B+A+C+E+D+F

Еще съешь этих французских мягких булочек.

Для повышения точности слияния, и притяжения семантики, требуется огромное количество информации и усложнение алгоритма.

Так же нужен дополнительный алгоритм проверки количества вхождений с разбавкой солью.

Но опять таки боты на это не поведутся :-)

Текст должен быть тематическим, тематическая семантика требуется. Это отдельный сложный алгоритм.

Забыл указать, что энтропия неизбежна. Это еще один алгоритм.

P.S.S

Тут целая наука, и люди тратят годы, чтобы получить более или менее работающие алгоритмы, на холяву таким не разбрасываются

Спустя 10 часов, 32 минуты, 45 секунд (7.12.2011 - 05:49) yuriy написал(а):
Привет!
I++
Ты смотри, что творится! Не хотят таки кафедралы с МГУ делиться секретом бредогенератора! ) Ну, придётся своего болтунчика изобретать, что тут поделаешь. Большое спасибо за подсказочку! Тема топика то потихоньку раскрывается! Как говорится с мира по нитке. ))

Спустя 9 минут, 59 секунд (7.12.2011 - 05:59) yuriy написал(а):
Есть массивы:
1. имена людей,
2. название стран,
3. название художественных фильмов,
4. название жанров.

Подготовил пару десятков шаблонов типа:

"Режиссёр " . R . " снял новый фильм '" . F . "'.";
"<strong>Скачайте фильм</strong> '" . F . "' , который снят в стране " . С . ".";

Вот уже и что-то близкое к осмысленной бредогенерации. )

Спустя 1 минута, 26 секунд (7.12.2011 - 06:01) yuriy написал(а):
И тематика соблюдена и вроде как осмысленно, да ещё ключевиков запихать можно. А? )


_____________
void x;
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.