Страница: 1 |
Страница: 1 |
Вопрос: по поводу грабера страниц
Добавлено: 02.05.07 15:08
Автор вопроса: Champion | Web-сайт:
идей - 0 целых 0 десятых
задача: грабить текстовую информацию(1ая,2ая и т.д. страницы), на сайтах, где используется индентификация пользователя, т.е. поля логин и пароль
сложность именно в последнем, как залогиниться на сайте?
для получения страниц использую класс винсока
я где-то понимаю, что это делается коммандами гэт и пост, кажется ... но совсем не разбираюсь как
ребят, помогите примером(или добрым словом%) ...
просто, по работе, ежедневно нужно кучу страниц перечитывать
готовые программы не предлагайте) ... для интересующей информации не подходят те, что видел
Ответы
Всего ответов: 9
Номер ответа: 1
Автор ответа:
D o c a l
ICQ: 408802757
Вопросов: 76
Ответов: 985
Web-сайт:
Профиль | | #1
Добавлено: 02.05.07 15:17
Номер ответа: 2
Автор ответа:
Champion
ICQ: 461506481
Вопросов: 38
Ответов: 88
Web-сайт:
Профиль | | #2
Добавлено: 02.05.07 15:43
да мне не нужно леваком заходить)
а собой) .. своим логином и паролем
Номер ответа: 3
Автор ответа:
Павел
Администратор
ICQ: 326066673
Вопросов: 368
Ответов: 5968
Web-сайт:
Профиль | | #3
Добавлено: 02.05.07 15:50
Могу написать за скромную плату. Опыт гигантский.
Вообще Winsock - это жестоко. Лучше поискать какую-нибудь библиотечку,
реализующую общение по протоколу HTTP.
Номер ответа: 4
Автор ответа:
Champion
ICQ: 461506481
Вопросов: 38
Ответов: 88
Web-сайт:
Профиль | | #4
Добавлено: 02.05.07 16:19
Павел) ... не могу достучаться до тебя в аське
Номер ответа: 5
Автор ответа:
Champion
ICQ: 461506481
Вопросов: 38
Ответов: 88
Web-сайт:
Профиль | | #5
Добавлено: 02.05.07 17:04
УРА!
НАШЁЛ!
scrrun.dll творит чудеса
Номер ответа: 6
Автор ответа:
Sharp
Лидер форума
ICQ: 216865379
Вопросов: 106
Ответов: 9979
Web-сайт:
Профиль | | #6
Добавлено: 02.05.07 19:15
Берешь сниффер, заходишь через броузер, выполняешь нужные действия, потом просто из своей программы посылаешь отнюханные пакеты.
Номер ответа: 7
Автор ответа:
Champion
ICQ: 461506481
Вопросов: 38
Ответов: 88
Web-сайт:
Профиль | | #7
Добавлено: 02.05.07 19:36
да ... что-то не подумал фундаментально так подойти к вопросу со стороны снифера)
я не дописал на радостях, потому что вручную пересмотрел у каких баттонов на странице, какие неймы и какие валюи
3-4 ключа обычно на поиск и 3 на логин)
а я ведь с сетевыми языками абсолютно не знаком
но как же всё гениально просто)
Номер ответа: 8
Автор ответа:
Павел
Администратор
ICQ: 326066673
Вопросов: 368
Ответов: 5968
Web-сайт:
Профиль | | #8
Добавлено: 02.05.07 20:50
Основная идея - мониторить трафик (идеально подходит для этого
программа Fiddler), и добиваться максимального совпадения поведения
своей программы и настоящего браузера.
Номер ответа: 9
Автор ответа:
Павел
Администратор
ICQ: 326066673
Вопросов: 368
Ответов: 5968
Web-сайт:
Профиль | | #9
Добавлено: 02.05.07 20:52
А выдирание данных из полученного HTML удобней всего производить с
помощью регулярных выражений.