Публикации в вебе в последнее время стали обыденным делом: кто-то пишет блоги, кто-то ведет сайты или пишет статьи для порталов. Во всех этих случаях возникает необходимость подготовки текcта с HTML-разметкой. Ввиду начавшегося на форуме обсуждения появилась идея поделиться своим опытом.
Для начала определимся, о какой разметке пойдет речь. Если вы создаете документ по типу документации, который используется сам по себе и его внешний вид должен быть достаточно сложным, с каскадными таблицами стилей, фоновыми изображениями и т.п., то данная статья вам мало поможет. В таких случаях нужно иметь детальное представление о тегах HTML, особенностях верстки и т.д.
В случае публикации на каком-либо ресурсе, требования к структуре документа гораздо проще: сайты, как правило, имеют свой собственный CSS, в котором уже заранее заданы размеры шрифтов, цвет , начертание для разных элементов и вам нужно подготовить только простую разметку: разбить текст на параграфы, выделить заголовки и подзаголовки, вставить несколько картинок.
Мне часто приходится готовить такие текстовые блоки. Расставить вручную теги не сложно, но это монотонная операция, которая занимает порой массу времени. Плюс не исключены опечатки в тегах, в результате которых внешний вид статьи может сильно искажаться. Естественно я пытался использовать уже существующие средства для автоматизации этой задачи, но как показала практика все они чрезмерно «усердствуют», экспортируя текст в HTML, нагружая его избыточными теговыми конструкциями. Поэтому и возникла идея сделать простенькую программку для таких операций.
Идея программки заключается в следующем: используя простой текстовый редактор, мы разбиваем текст на строки. Каждая строчка интерпретируется как отдельный элемент, в простейшем случае — это параграф. Т.е. клавишу [Enter] мы нажимаем при наборе текста только в конце параграфа, или в конце заголовка. Если строка текста должна иметь определенные свойства, то в ее начале ставится символ, который обычно не встречается в начале строки, например, такие как: $#%&
Поскольку текст набирается в графическом редакторе, то естественно, что хотелось бы иметь программу для конвертации с графическим интерфейсом и как можно менее громоздкую. Поэтому выбор пал на PHP — веб-приложение в данном случае наиболее простой вариант: оно мультиплатформенное, не требует компиляции и легко переносимо при обновлении дистрибутива. Кроме того, в этом случае вы можете тут же увидеть результата конвертации в окне браузера.
Кода в такой программке получилось очень мало — она не тянет даже на какой-то отдельный проект, но эксплуатация ее на практике показала, что это очень эффективное средство экономии времени, причем черновую подготовку текста и генерацию разметки можно поручить непрофессионалу, оставив себе только доводку результатов генерации (вставку ссылок, картинок и т.п.), что встречается в тексте редко и автоматизировать их вставку нет смысла.
Теперь все выше изложенное продемонстрирую «в картинках». Эта статья делалась именно таким способом. Для набора текста я использовал KWrite — шустрое и легкое приложение, которое правда наделено огромным функционалом:
Следующим, необязательным этапом, нажав F10 и F11, проверяем, что все параграфы — это отдельные строчки:
В браузере (я использую для таких целей Konqueror: он в таких случаях шустрее Mozilla и Firefox) загружаем приложение на PHP, и вставляем текст, скопировав его из текстового редактора:
Кстати, на этом этапе есть возможность проверки орфографии. Жмем кнопку «Сгенерировать разметку для текста» и результат получаем в новой вкладке:
Теперь либо сохраняем документ, либо открываем содержимое страницы для просмотра в редакторе (у меня это все тот же KWrite):
Добавляем нужные теги (напр. для вставки изображений), при необходимости меняем кодировку (по умолчанию — UTF8) и все, страница готова! Все действия занимают совсем мало времени — несколько щелчков мышью. Основное — набрать текст. Краткая справка по форматированию доступна на странице самого конвертора. Если у вас наблюдается клиническая склонность к программированию, вы легко можете добавить новые возможности форматирования или же изменить/улучшить имеющиеся.
Генератор HTML вы можете скачать в прилагаемом архиве. Для его работы нужен Apache сервер с поддержкой PHP. Установка Apache на Линуксе тривиальная задача, часто он ставится по умолчанию при инсталляции системы. Директорию TXT2HTML из архива скопируйте в апачевский домашний каталог (обычно /var/www/html/) и запустите по адресу http://localhost/TXT2HTML
Скачать генератор HTML
Естественно, описанный метод не отменяет знания тегов HTML. В качестве справочного материала могу рекомендовать онлайн-справочник http://htmlbook.ru, который, при желании, можно скачать, используя wget ;)
Автор: Игорь Новиков
Нет ответов на “Черновая конвертация текста в HTML”