Не подскажите какой-нибудь скрипт на PHP для генерации удобоваримого текста для поисковика.
Спустя 2 минуты, 28 секунд (6.12.2011 - 12:47) Семён написал(а):
Спустя 38 минут, 42 секунды (6.12.2011 - 13:26) yuriy написал(а):
Есть, допустим, у меня некий генератор текста с включением в него ключевых слов. Получается микс с простым текстом с включениями '<strong>', '<a>' и '<h1>' тегов. Как оценить, вообще, скушает ли поисковик эту кашу или скажет "какая гадость ваша заливная рыба".
Спустя 1 минута, 59 секунд (6.12.2011 - 13:28) yuriy написал(а):
Не подскажите, может есть какие-то инструменты, где можно посмотреть "вкусный" ли текст для поисковика или не очень.
Спустя 21 минута, 23 секунды (6.12.2011 - 13:50) Семён написал(а):
Поисковики давно не ведутся на кашу из ключевых слов.
Спустя 21 минута, 44 секунды (6.12.2011 - 14:11) yuriy написал(а):
Ну вот и стоит у меня задача, чтобы повелись и текст был как "настоящий". Задача не очень тривиальная, да? Тем она и хороша. )
Спустя 1 минута, 26 секунд (6.12.2011 - 14:13) yuriy написал(а):
Только нужно где-то индикатор найти, по которому можно определять "вкусность" текста для поисковика. )
Спустя 35 минут, 35 секунд (6.12.2011 - 14:48) vital написал(а):
Спустя 1 минута, 29 секунд (6.12.2011 - 14:50) vital написал(а):
Цитата (yuriy @ 6.12.2011 - 13:11) |
Ну вот и стоит у меня задача, чтобы повелись и текст был как "настоящий". Задача не очень тривиальная, да? Тем она и хороша. ) |
Ну есть много разных алгоритмов -но для большинства из них есть "контр" алгоритмы.
А те к-е работают - за спасибо на форуме вам никто не спалит.
Спустя 5 минут, 57 секунд (6.12.2011 - 14:56) yuriy написал(а):
Это точно. Такой алгоритм никто не спалит. ) Ну и на том спасибо. Уже кое-что. Будем помаленечку подбираться к такому алгоритму. Цепи Маркова, говорят, сильно помогают в этом вопросе, даже чуть ли не нейронные сети. Только вот сколько это чудо съест времени и ресурсов.
Спустя 49 секунд (6.12.2011 - 14:57) yuriy написал(а):
Времени и ресурсов веб-сервера, естественно.
Спустя 1 минута, 38 секунд (6.12.2011 - 14:58) vital написал(а):
Цитата (yuriy @ 6.12.2011 - 13:56) |
Это точно. Такой алгоритм никто не спалит. ) Ну и на том спасибо. Уже кое-что. Будем помаленечку подбираться к такому алгоритму. Цепи Маркова, говорят, сильно помогают в этом вопросе, даже чуть ли не нейронные сети. Только вот сколько это чудо съест времени и ресурсов. |
Цепи маркова - я вам привел на сайте vesna.yandex.ru.
Было актуально году в 2002м.
Не тратте время.
Спустя 4 минуты, 54 секунды (6.12.2011 - 15:03) yuriy написал(а):
Ну тогда тупо брать текстовку из RSS-канала, пропускать её через рандомизатор и подмешивать ключевых слов. Думаю, тоже не плохое решение.
Спустя 34 секунды (6.12.2011 - 15:04) vital написал(а):
Цитата (yuriy @ 6.12.2011 - 14:03) |
Ну тогда тупо брать текстовку из RSS-канала, пропускать её через рандомизатор и подмешивать ключевых слов. Думаю, тоже не плохое решение. |
Такой же боян как и цепи маркова.
Спустя 10 минут, 5 секунд (6.12.2011 - 15:14) yuriy написал(а):
А что по-вашему тогда не боян, осмелюсь спросить? )
Спустя 1 минута, 49 секунд (6.12.2011 - 15:16) yuriy написал(а):
база оконченных предложений, которые потом можно менять местами?
Спустя 4 часа, 1 минута, 3 секунды (6.12.2011 - 19:17) I++ написал(а):
Подобные алгоритмы существуют, разрабатывались на кафедре МГУ не один год, данные алгоритмы секретны, и никто Вам их не даст, а уж тем более готовое решение.
Так, что тема данного топика никогда не будет раскрыта.
В далеких 2000 годах, был кайф дорвеи плодить, трафика в месяц по 15 лямов с дора собирал.
Но раньше алгоритмы были проще, сейчас эникеем не получится )
Дам небольшую подсказочку по теме.
"Cъешь еще этих мягких французских булочек"
Cъешь = A
еще = B
этих = C
мягких = D
французских = E
булочек = F
A+B+C+D+F+E
array {
AB + WEIGHT
ABC + WEIGHT
BC + WEIGHT
BCD + WEIGHT
CD + WEIGHT
DF + WEIGHT
DFE + WEIGHT
FE + WEIGHT
}
B+A+C+E+D+F
Еще съешь этих французских мягких булочек.
Для повышения точности слияния, и притяжения семантики, требуется огромное количество информации и усложнение алгоритма.
Так же нужен дополнительный алгоритм проверки количества вхождений с разбавкой солью.
Но опять таки боты на это не поведутся :-)
Текст должен быть тематическим, тематическая семантика требуется. Это отдельный сложный алгоритм.
Забыл указать, что энтропия неизбежна. Это еще один алгоритм.
P.S.S
Тут целая наука, и люди тратят годы, чтобы получить более или менее работающие алгоритмы, на холяву таким не разбрасываются
Так, что тема данного топика никогда не будет раскрыта.
В далеких 2000 годах, был кайф дорвеи плодить, трафика в месяц по 15 лямов с дора собирал.
Но раньше алгоритмы были проще, сейчас эникеем не получится )
Дам небольшую подсказочку по теме.
"Cъешь еще этих мягких французских булочек"
Cъешь = A
еще = B
этих = C
мягких = D
французских = E
булочек = F
A+B+C+D+F+E
array {
AB + WEIGHT
ABC + WEIGHT
BC + WEIGHT
BCD + WEIGHT
CD + WEIGHT
DF + WEIGHT
DFE + WEIGHT
FE + WEIGHT
}
B+A+C+E+D+F
Еще съешь этих французских мягких булочек.
Для повышения точности слияния, и притяжения семантики, требуется огромное количество информации и усложнение алгоритма.
Так же нужен дополнительный алгоритм проверки количества вхождений с разбавкой солью.
Но опять таки боты на это не поведутся :-)
Текст должен быть тематическим, тематическая семантика требуется. Это отдельный сложный алгоритм.
Забыл указать, что энтропия неизбежна. Это еще один алгоритм.
P.S.S
Тут целая наука, и люди тратят годы, чтобы получить более или менее работающие алгоритмы, на холяву таким не разбрасываются
Спустя 10 часов, 32 минуты, 45 секунд (7.12.2011 - 05:49) yuriy написал(а):
Привет!
I++
Ты смотри, что творится! Не хотят таки кафедралы с МГУ делиться секретом бредогенератора! ) Ну, придётся своего болтунчика изобретать, что тут поделаешь. Большое спасибо за подсказочку! Тема топика то потихоньку раскрывается! Как говорится с мира по нитке. ))
I++
Ты смотри, что творится! Не хотят таки кафедралы с МГУ делиться секретом бредогенератора! ) Ну, придётся своего болтунчика изобретать, что тут поделаешь. Большое спасибо за подсказочку! Тема топика то потихоньку раскрывается! Как говорится с мира по нитке. ))
Спустя 9 минут, 59 секунд (7.12.2011 - 05:59) yuriy написал(а):
Есть массивы:
1. имена людей,
2. название стран,
3. название художественных фильмов,
4. название жанров.
Подготовил пару десятков шаблонов типа:
"Режиссёр " . R . " снял новый фильм '" . F . "'.";
"<strong>Скачайте фильм</strong> '" . F . "' , который снят в стране " . С . ".";
Вот уже и что-то близкое к осмысленной бредогенерации. )
1. имена людей,
2. название стран,
3. название художественных фильмов,
4. название жанров.
Подготовил пару десятков шаблонов типа:
"Режиссёр " . R . " снял новый фильм '" . F . "'.";
"<strong>Скачайте фильм</strong> '" . F . "' , который снят в стране " . С . ".";
Вот уже и что-то близкое к осмысленной бредогенерации. )
Спустя 1 минута, 26 секунд (7.12.2011 - 06:01) yuriy написал(а):
И тематика соблюдена и вроде как осмысленно, да ещё ключевиков запихать можно. А? )
_____________
void x;