16 марта 2009

Быстрый просмотр тендерной документации

Добавлена возможность быстрого просмотра файлов документации (пока только для тендеров федерального портала). Рядом со ссылкой на файл документации тендера (который хранится на нашем сервере) приводится ссылка "Текст", по которой можно просмотреть результат конвертации файла документации в текст. Поддерживается большинство офисных форматов: doc, rtf, shs, docx, docm, xls, xlsx, xlk, ppt, odt, ods, odp, sxw, pdf, html, а также архиваторы: rar, zip, 7z, gzip, bzip2, arj, в том числе многотомные rar и 7z. Там же можно просмотреть список всех файлов документации, их размеры, открыть отдельные графические файлы.
К сожалению, некоторые pdf файлы невозможно преобразовать в текст, поскольку они являются отсканированными образами документов. На настоящий момент это единственное ограничение конвертации. Можно было бы ввести OCR для распознавания текста, но другие расширения функциональности признаны более целесообразными. Кстати, некоторое количество архивов диагностируются как битые - заголовки файлов читаются, но сами файлы вероятно искажены в процессе передачи. Полученные в результате конвертации тексты будут использованы в дальнейшем в поисковой системе для поиска по документации.