Страница: 1 | 2 |
Вопрос: Сразу несколько очень важных вопросов в одной теме
Добавлено: 21.05.07 16:12
Автор вопроса: Lanback | ICQ: 271-209-305
В рамках дипломного проекта написал прогу полнотекстового поиска. По сравнению с другими крутыми коммерческими проектами индексирует инфу в 4 раза медленее, но ищет потом в итоге более качественно и быстрее. Хочу оптимизировать процесс индексации. В связи с этим вопрос:
Как вытащить текстовое содержимое из файлов *.doc и *.html, не используя winword и WebBrowser? Уточнение: для html - именно тот текст, что отображает веб-страница.
Ну и ещё пару вопросов наболевших:
1)При вызове контекстного меню для папки зависает и Тотал и Windows Explorer, для файла если вызывать -всё ОК. После переустановки винды - всё нормуль. Потом - через некоторое время - бок. В чём дело - непонятно! Может кто сталкивался?
2)Как программно вызвать меню свойст файла в VB.NET?
Заранее благодарен!
Ответы
Всего ответов: 25
Номер ответа: 1
Автор ответа:
ZagZag
ICQ: 295002202
Вопросов: 87
Ответов: 1684
Профиль | | #1
Добавлено: 21.05.07 19:23
Наверняка ты какую-нибудь софтину ставишь (или это делает кто-то другой на твоем компьютере). А эта софтина глючная или после деинсталляции оснавляет записи в реестре.
Вывод:
1. Почисти реестр (CCleaner и т.п.)
2. Проследи после установки или деинсталляции какой проги происходит такая бадяга - прога виновата, выкинь ее.
3. Переставь винды и жди следующего раза =P
Номер ответа: 2
Автор ответа:
Lanback
ICQ: 271-209-305
Вопросов: 23
Ответов: 48
Профиль | | #2
Добавлено: 21.05.07 21:05
Может это и софтина влияет...Но определить её никак не могу! Вроде после переустановки всё нормально-нормально, а потом вдруг раз - и на тебе, снова не работает...
Номер ответа: 3
Автор ответа:
Lanback
ICQ: 271-209-305
Вопросов: 23
Ответов: 48
Профиль | | #3
Добавлено: 21.05.07 22:09
И тишина...
Номер ответа: 4
Автор ответа:
Sharp
Лидер форума
ICQ: 216865379
Вопросов: 106
Ответов: 9979
Web-сайт:
Профиль | | #4
Добавлено: 22.05.07 00:18
Для HTML отсеять теги, на этом форуме проскакивал мой код, который был рожден долгими издевательствами над IE
Номер ответа: 5
Автор ответа:
Lanback
ICQ: 271-209-305
Вопросов: 23
Ответов: 48
Профиль | | #5
Добавлено: 22.05.07 00:58
Не мог бы ты мне его выслать?! unimail@i.ua
Номер ответа: 6
Автор ответа:
HACKER
Разработчик Offline Client
Вопросов: 236
Ответов: 8362
Профиль | | #6
Добавлено: 22.05.07 01:47
В 2007 офисе проблем с доками нет - полностью открытый xml. До 2007, придётся использоваться всётаки объектную модель вердра в своей программе. При этом сам вёрд на компьютере не обязательно должен быть установлен (если воспользоваться инсталятором который соберёт нужные файлы).
С хтмл думаю ничего сложно. Любой тег начинается с "<" и заканчивается ">", все что между тегами и есть текст, за исключением js/css/vbs. Возможно ещё есть несколько тегов вроде Object который внутри себя содержит опции для объекта, а не текст, но всё это можно предусмотреть. Так что примерный алгоритм понятный, развить тему, покодить.. Да ладно, щутка, конечно я понимаю что хочеться готовое...
По поводу наболевших вопросов, они хоть и оффтопные, ну да ладно
Я не сталкивался, но попробуй забекапь когда всё ок весь раздел реестра HKEY_CLASSES_ROOT\Folder а когда заглючит - востанови.
Может я поспешу ответив, т.к. в .net практически ничего несмыслю, но думаю аналогично как и везде - win32 api. Могу ошибаться, но вроде это делалось как-то через ShellExecuteEX, туда структурка передавалась с путем к файлу...
Номер ответа: 7
Автор ответа:
Lanback
ICQ: 271-209-305
Вопросов: 23
Ответов: 48
Профиль | | #7
Добавлено: 22.05.07 21:47
Немного неправильно сказал: не свойства файла, а контекстное меню, которое появляется при клике на файл правой кнопкой миши!
Номер ответа: 8
Автор ответа:
Nash Bridges
Вопросов: 5
Ответов: 139
Профиль | | #8
Добавлено: 23.05.07 04:10
правда? нужный файлы это половина ворда? или весь? и как это с лицензией соотноситься?
Номер ответа: 9
Автор ответа:
Champion
ICQ: 461506481
Вопросов: 38
Ответов: 88
Web-сайт:
Профиль | | #9
Добавлено: 23.05.07 07:20
Lanback
есть пример на VB6 - вызов свойств файла или папки и добавление своих пунктов
на net, не знаю будет ли работать
Номер ответа: 10
Автор ответа:
ZagZag
ICQ: 295002202
Вопросов: 87
Ответов: 1684
Профиль | | #10
Добавлено: 23.05.07 08:50
Champion, кинь мне zagzag2003+@+mail.ru (без плюсов). Или сюда выложи (по теме ведь)
Номер ответа: 11
Автор ответа:
Champion
ICQ: 461506481
Вопросов: 38
Ответов: 88
Web-сайт:
Профиль | | #11
Добавлено: 23.05.07 10:11
ZagZag
лови 21КБ zip вложение
Номер ответа: 12
Автор ответа:
ZagZag
ICQ: 295002202
Вопросов: 87
Ответов: 1684
Профиль | | #12
Добавлено: 23.05.07 12:00
Клево, пасиба! Давно искал как такое сделать.
Номер ответа: 13
Автор ответа:
Lanback
ICQ: 271-209-305
Вопросов: 23
Ответов: 48
Профиль | | #13
Добавлено: 23.05.07 17:59
Champion, дай, пожалуйста, автору вопроса: unimail@i.ua
Номер ответа: 14
Автор ответа:
HACKER
Разработчик Offline Client
Вопросов: 236
Ответов: 8362
Профиль | | #14
Добавлено: 23.05.07 18:50
Правда. И не половина вёрда, а несколько файлов. Какие именно я непомню, чё я тебе инсталятор что-ли.. открой свой prj да посмотри...
С лицензий тоже думаю проблем небудет. Контрол ведь не зря открытый и абсолютно сводобный. Да и только для чтения есть абсолютно отдельная тулза от офиса, которая распостраняется мс бесплатно. Так что с этим проблем нет.
Номер ответа: 15
Автор ответа:
Nash Bridges
Вопросов: 5
Ответов: 139
Профиль | | #15
Добавлено: 23.05.07 19:19
2HACKER:
бред. теплое с красным попутал.