Прочитать .doc на C#
От: Аноним  
Дата: 01.10.10 21:46
Оценка:
Народ, подскажите, а как мне прочитать Word файл на C#?

По хорошему мне нужно читать по странично. Ну т.е. в .doc файле есть страницы, мне нужно почитать по страницам.
Re: Прочитать .doc на C#
От: _FRED_ Россия
Дата: 01.10.10 22:00
Оценка: 1 (1)
Здравствуйте, Аноним, Вы писали:

А>Народ, подскажите, а как мне прочитать Word файл на C#?


А>По хорошему мне нужно читать по странично. Ну т.е. в .doc файле есть страницы, мне нужно почитать по страницам.


Выбирайте.
Help will always be given at Hogwarts to those who ask for it.
Re: Прочитать .doc на C#
От: Аноним  
Дата: 03.10.10 15:30
Оценка:
Народ, по советам, я doc файл преобразовал в docx(через офис)
В итоге я смог прочитать docx файл. Теперь у меня xml данные, но их мне нужно преобразовать в html
Поогите, как это сделать?
Re[2]: Прочитать .doc на C#
От: MozgC США http://nightcoder.livejournal.com
Дата: 03.10.10 15:40
Оценка:
Я бы действовал по такому алгоритму:

1) Поискал бы в гугле какие-то 3rd party библиотеки для этого.
2) Если бы ничего не нашел, то пришлось бы использовать Word Automation. Automation штука глючноватая конечно, да и Word должен быть установлен на компе, но если ничего другого не подойдет...

Еще решение зависит от того, какого типа html должен быть на выходе, т.е. насколько сложный входной doc файл. Вдруг у вас там тупо абзацы текста, тогда можно просто вставить этот текст в html шаблон внутри тегов <p>.
Re[3]: Прочитать .doc на C#
От: Аноним  
Дата: 03.10.10 16:28
Оценка:
Здравствуйте, MozgC, Вы писали:

MC>Я бы действовал по такому алгоритму:


MC>1) Поискал бы в гугле какие-то 3rd party библиотеки для этого.

MC>2) Если бы ничего не нашел, то пришлось бы использовать Word Automation. Automation штука глючноватая конечно, да и Word должен быть установлен на компе, но если ничего другого не подойдет...

MC>Еще решение зависит от того, какого типа html должен быть на выходе, т.е. насколько сложный входной doc файл. Вдруг у вас там тупо абзацы текста, тогда можно просто вставить этот текст в html шаблон внутри тегов <p>.


>html должен быть на выходе, т.е. насколько сложный входной doc файл.

doc файл обычный, содержит одни абазцы и "переводы на другие страницы", т.е. мне нужно что бы вот разделение на страницы как то помечалось.


Я тут нашёл одно решение
http://www.codeproject.com/KB/XML/XML_to_HTML_Convertor.aspx
но нужен некий xsl шаблон, но никак не понимаю как его сделать...
Может кто подскажет с ним?
Re[4]: Прочитать .doc на C#
От: MozgC США http://nightcoder.livejournal.com
Дата: 03.10.10 16:33
Оценка: +1
Здравствуйте, Аноним, Вы писали:

А>Я тут нашёл одно решение

А>http://www.codeproject.com/KB/XML/XML_to_HTML_Convertor.aspx
А>но нужен некий xsl шаблон, но никак не понимаю как его сделать...
А>Может кто подскажет с ним?

Я бы взял и сам разобрался с основами XSLT, полезно будет, еще пригодится в будущем.
Re[5]: Прочитать .doc на C#
От: Аноним  
Дата: 07.10.10 15:59
Оценка:
Народ, ну помогите составить.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.