Здравствуйте. Не могу справиться с проблемой, пытаюсь качать из Инета с помощью OpenURL или Execute, "GET". Но странички сохраняются так, как будто в браузере выбрали при сохранении тип файла html, а хорошо бы, чтобы сохранялись как txt, тогда больше информации запомнится, как быть?
Private Const INTERNET_OPEN_TYPE_PRECONFIG = 0
Private Const INTERNET_OPEN_TYPE_DIRECT = 1
Private Const INTERNET_OPEN_TYPE_PROXY = 3
Private Const scUserAgent = "VB Project"
Private Const INTERNET_FLAG_RELOAD = &H80000000
Private Declare Function InternetOpen Lib "wininet.dll" Alias "InternetOpenA" (ByVal sAgent As String, ByVal lAccessType As Long, ByVal sProxyName As String, ByVal sProxyBypass As String, ByVal lFlags As Long) As Long
Private Declare Function InternetOpenUrl Lib "wininet.dll" Alias "InternetOpenUrlA" (ByVal hOpen As Long, ByVal sUrl As String, ByVal sHeaders As String, ByVal lLength As Long, ByVal lFlags As Long, ByVal lContext As Long) As Long
Private Declare Function InternetReadFile Lib "wininet.dll" (ByVal hFile As Long, ByVal sBuffer As String, ByVal lNumBytesToRead As Long, lNumberOfBytesRead As Long) As Integer
Private Declare Function InternetCloseHandle Lib "wininet.dll" (ByVal hInet As Long) As Integer
Private Function OpenURL(ByVal sUrl As String) As String
Dim hOpen As Long
Dim hOpenUrl As Long
Dim bDoLoop As Boolean
Dim bRet As Boolean
Dim sReadBuffer As String * 2048
Dim lNumberOfBytesRead As Long
Dim sBuffer As String
hOpen = InternetOpen(scUserAgent, INTERNET_OPEN_TYPE_PRECONFIG, vbNullString, vbNullString, 0)
hOpenUrl = InternetOpenUrl(hOpen, sUrl, vbNullString, 0, INTERNET_FLAG_RELOAD, 0)
bDoLoop = True
While bDoLoop
sReadBuffer = vbNullString
bRet = InternetReadFile(hOpenUrl, sReadBuffer, Len(sReadBuffer), lNumberOfBytesRead)
sBuffer = sBuffer & Left$(sReadBuffer, lNumberOfBytesRead)
bDoLoop = CBool(lNumberOfBytesRead)
Wend
If hOpenUrl <> 0 Then InternetCloseHandle (hOpenUrl)
If hOpen <> 0 Then InternetCloseHandle (hOpen)
OpenURL = sBuffer
End Function
Функция возвращает HTML-код странички. А дальше - просто сохранить.
Но странички сохраняются так, как будто в браузере выбрали при сохранении тип файла html, а хорошо бы, чтобы сохранялись как txt, тогда больше информации запомнится, как быть?
Можешь посчитать меня тупым, но ты явно сама не знаешь что хочешь. Ты качаешь страничку, страничка это есстно хтмл, а хочешь видеть нормальный текст. Пойми всё что ты видишь в браузере это хтмл, а в читабельный текст уже приобразовует браузер!!! Поэтому тебе придётся расслабиться, ну или самой убирать теги, парсить, ну короче доводить текст до читаемого твоим глазом. Всё конечно можно, но сложно, к тому же это даст только 80% нормального текста. Текст часто бывает изминяется под действием скриптом, которые реагируют не действия пользователя. Вообщем нормальный текст с хтмл странички в тхт файле тебе не видать. (Сорри если я не прав)
Но странички сохраняются так, как будто в браузере выбрали при сохранении тип файла html, а хорошо бы, чтобы сохранялись как txt, тогда больше информации запомнится
Но странички сохраняются так, как будто в браузере выбрали при сохранении тип файла html, а хорошо бы, чтобы сохранялись как txt, тогда больше информации запомнится
ет как так?
Действительно, девушка что-то странное написала. Инфы сохраниться столько же, только размер будет разный. Но все равно хочется вставить замечание HACKER'а