У меня к вам вопрос, вот когого плана:
Мне очень давно заинтересовал язык PHP, я его немного изучил(сайты делать могу), но теперь с толкнулся с проблеммой наполнения базы данных(например книги(название, сордержание, размер, скачать и тд))! МОЖНО ЛИ сделать такой скрипт чтобы он вытаскивал все вот эти данные (название, сордержание, размер, скачать и тд) и вставлял мне в мою базу данных, с чем я бы в дальнейшем смог работать?
НО ПАРОЛЯ К ЧУЖОЙ БАЗЕ Я ЕСТЕСТВЕННО ЗНАТЬ НЕ БУДУ!!!
Может ктото уже делал?
может уже есть такой скрипт?
МОЖЕТ ЕСТЬ ИННОЙ СПОСОБ НАПОЛНЕНИЯ БАЗЫ (РЕЧЬ ИДЕТ НЕ О 50 КНИГАХ А О 1000, КАК УСКОРИТЬ ПРОЦЕСС НАПОЛНЕНИЯ?)
кто что знает прошу помоч!
Огромное спасибо заранее всем!!!
Спустя 39 минут, 37 секунд (2.06.2009 - 20:59) kirik написал(а):
Цитата (denkut @ 2.06.2009 - 12:19) |
МОЖНО ЛИ сделать такой скрипт чтобы он вытаскивал все вот эти данные (название, сордержание, размер, скачать и тд) и вставлял мне в мою базу данных, с чем я бы в дальнейшем смог работать? |
Можно.
Цитата (denkut @ 2.06.2009 - 12:19) |
НО ПАРОЛЯ К ЧУЖОЙ БАЗЕ Я ЕСТЕСТВЕННО ЗНАТЬ НЕ БУДУ!!! |
Интересное дело.. А ты сможешь зайти в чужую квартиру не имея ключа?
Спустя 1 минута, 47 секунд (2.06.2009 - 21:01) twin написал(а):
Тут много кто знает и делал. А какой именно скрипт нужен? Такого, чтоб как щука по моему хотению все равно нет, надо конкретные условия. Где эти книги, в чужой базе что ли? Так это пахнет керосином... Можно чуточку яснее сви мысли излагать?
Спустя 21 час, 42 минуты, 47 секунд (3.06.2009 - 18:44) Guest написал(а):
я привел пример (книги) на самом деле может быть все что угодно, хоть скрипты хоть статьи! например сайт http://www.knigka.info/ вот там книг море, как бы у них "украсть" их автоматически(а не по одной копировать), ссылки на скачку например остались бы ихи!
Спустя 5 минут, 57 секунд (3.06.2009 - 18:50) Kuliev написал(а):
Цитата (Guest @ 3.06.2009 - 20:44) |
я привел пример (книги) на самом деле может быть все что угодно, хоть скрипты хоть статьи! например сайт http://www.knigka.info/ вот там книг море, как бы у них "украсть" их автоматически(а не по одной копировать), ссылки на скачку например остались бы ихи! |
Ишь чего захотел
Спустя 1 час, 19 минут, 34 секунды (3.06.2009 - 20:09) glock18 написал(а):
пиши спайдер. или моли администрацию сайта, чтобы тебе ссылочки сами дали.
Спустя 20 часов, 14 минут, 2 секунды (4.06.2009 - 16:23) denkut написал(а):
а что такое спайдер?
Спустя 28 минут, 30 секунд (4.06.2009 - 16:52) glock18 написал(а):
denkut
Ты меня поражаешь раз за разом. Ну поиском воспользуйся что ли наконец.
Вот я когда слово незнакомое вижу - иду в поиск. И ты так же делай - поверь, так тебе больше пользы будет.
Ты меня поражаешь раз за разом. Ну поиском воспользуйся что ли наконец.
Вот я когда слово незнакомое вижу - иду в поиск. И ты так же делай - поверь, так тебе больше пользы будет.
Спустя 4 часа, 49 минут, 17 секунд (4.06.2009 - 21:41) denkut написал(а):
я находил это слово в поиске, но там нечего вразумительного нету, (там выводят типо это фотопорат и тд) объясни поподробнее или дай ссылку на ресурс пожалуйста
Спустя 1 час, 32 минуты, 9 секунд (4.06.2009 - 23:13) glock18 написал(а):
Так понятно. И вправду по "спайдер" мало чего хорошего найдешь))) Приношу извинения за неточный совет. В общем то, я только на английском нашел описание на википедии. На деле же спайдер делает следующее:
1. Дергает html-страницу (если писать его будешь на php, то curl подойдет).
2. Дальше ты обрабатываешь страницу - для этого пишешь регулярные выражения (вероятнее всего без них там обойтись не удастся) для того, чтобы выделить из html-кода то, что тебе надо (ссылки, названия - что угодно).
3. Ссылки в твоем случае могут складываться сразу в базу (если это ссылку на книгу), либо, если это промежуточная ссылка - скажем, ссылка на категорию книг, то действия повторяешь с ней. То есть дергаешь ее, обрабатываешь, и повторяешь в цикле.
Тебе заранее придется самому пролазить по сайту (в роли спайдера), чтобы определить формат html-страницы для написания регулярных выражений. Ну вот, примерно так это делается. На сайте, который показал ты регистрация для этого не требуется, так что дополнительных трудностей быть не должно.
1. Дергает html-страницу (если писать его будешь на php, то curl подойдет).
2. Дальше ты обрабатываешь страницу - для этого пишешь регулярные выражения (вероятнее всего без них там обойтись не удастся) для того, чтобы выделить из html-кода то, что тебе надо (ссылки, названия - что угодно).
3. Ссылки в твоем случае могут складываться сразу в базу (если это ссылку на книгу), либо, если это промежуточная ссылка - скажем, ссылка на категорию книг, то действия повторяешь с ней. То есть дергаешь ее, обрабатываешь, и повторяешь в цикле.
Тебе заранее придется самому пролазить по сайту (в роли спайдера), чтобы определить формат html-страницы для написания регулярных выражений. Ну вот, примерно так это делается. На сайте, который показал ты регистрация для этого не требуется, так что дополнительных трудностей быть не должно.
Спустя 5 минут, 4 секунды (4.06.2009 - 23:18) Joker написал(а):
Посмотри слово в посковике "PHP парсер" и "php грабер"
Спустя 3 минуты, 25 секунд (4.06.2009 - 23:22) twin написал(а):
Не укради.
Спустя 9 часов, 39 минут, 38 секунд (5.06.2009 - 09:01) denkut написал(а):
спасибо большое всем за советы:)