• Главная
  • О проекте
  • Обратная связь

Logo

Navigation
  • Дизайн
  • Живопись
  • Фотография
  • 3D-графика
  • Видео
  • Музыка

Черновая конвертация текста в HTML

By Александр Прокудин | on 23.11.2008 | 0 Comment
Статьи

Публикации в вебе в последнее время стали обыденным делом: кто-то пишет блоги, кто-то ведет сайты или пишет статьи для порталов. Во всех этих случаях возникает необходимость подготовки текcта с HTML-разметкой. Ввиду начавшегося на форуме обсуждения появилась идея поделиться своим опытом.

Для начала определимся, о какой разметке пойдет речь. Если вы создаете документ по типу документации, который используется сам по себе и его внешний вид должен быть достаточно сложным, с каскадными таблицами стилей, фоновыми изображениями и т.п., то данная статья вам мало поможет. В таких случаях нужно иметь детальное представление о тегах HTML, особенностях верстки и т.д.

В случае публикации на каком-либо ресурсе, требования к структуре документа гораздо проще: сайты, как правило, имеют свой собственный CSS, в котором уже заранее заданы размеры шрифтов, цвет , начертание для разных элементов и вам нужно подготовить только простую разметку: разбить текст на параграфы, выделить заголовки и подзаголовки, вставить несколько картинок.

Мне часто приходится готовить такие текстовые блоки. Расставить вручную теги не сложно, но это монотонная операция, которая занимает порой массу времени. Плюс не исключены опечатки в тегах, в результате которых внешний вид статьи может сильно искажаться. Естественно я пытался использовать уже существующие средства для автоматизации этой задачи, но как показала практика все они чрезмерно «усердствуют», экспортируя текст в HTML, нагружая его избыточными теговыми конструкциями. Поэтому и возникла идея сделать простенькую программку для таких операций.

Идея программки заключается в следующем: используя простой текстовый редактор, мы разбиваем текст на строки. Каждая строчка интерпретируется как отдельный элемент, в простейшем случае — это параграф. Т.е. клавишу [Enter] мы нажимаем при наборе текста только в конце параграфа, или в конце заголовка. Если строка текста должна иметь определенные свойства, то в ее начале ставится символ, который обычно не встречается в начале строки, например, такие как: $#%&

Поскольку текст набирается в графическом редакторе, то естественно, что хотелось бы иметь программу для конвертации с графическим интерфейсом и как можно менее громоздкую. Поэтому выбор пал на PHP — веб-приложение в данном случае наиболее простой вариант: оно мультиплатформенное, не требует компиляции и легко переносимо при обновлении дистрибутива. Кроме того, в этом случае вы можете тут же увидеть результата конвертации в окне браузера.

Кода в такой программке получилось очень мало — она не тянет даже на какой-то отдельный проект, но эксплуатация ее на практике показала, что это очень эффективное средство экономии времени, причем черновую подготовку текста и генерацию разметки можно поручить непрофессионалу, оставив себе только доводку результатов генерации (вставку ссылок, картинок и т.п.), что встречается в тексте редко и автоматизировать их вставку нет смысла.

Теперь все выше изложенное продемонстрирую «в картинках». Эта статья делалась именно таким способом. Для набора текста я использовал KWrite — шустрое и легкое приложение, которое правда наделено огромным функционалом:

Следующим, необязательным этапом, нажав F10 и F11, проверяем, что все параграфы — это отдельные строчки:

В браузере (я использую для таких целей Konqueror: он в таких случаях шустрее Mozilla и Firefox) загружаем приложение на PHP, и вставляем текст, скопировав его из текстового редактора:

Кстати, на этом этапе есть возможность проверки орфографии. Жмем кнопку «Сгенерировать разметку для текста» и результат получаем в новой вкладке:

Теперь либо сохраняем документ, либо открываем содержимое страницы для просмотра в редакторе (у меня это все тот же KWrite):

Добавляем нужные теги (напр. для вставки изображений), при необходимости меняем кодировку (по умолчанию — UTF8) и все, страница готова! Все действия занимают совсем мало времени — несколько щелчков мышью. Основное — набрать текст. Краткая справка по форматированию доступна на странице самого конвертора. Если у вас наблюдается клиническая склонность к программированию, вы легко можете добавить новые возможности форматирования или же изменить/улучшить имеющиеся.

Генератор HTML вы можете скачать в прилагаемом архиве. Для его работы нужен Apache сервер с поддержкой PHP. Установка Apache на Линуксе тривиальная задача, часто он ставится по умолчанию при инсталляции системы. Директорию TXT2HTML из архива скопируйте в апачевский домашний каталог (обычно /var/www/html/) и запустите по адресу http://localhost/TXT2HTML

Скачать генератор HTML

Естественно, описанный метод не отменяет знания тегов HTML. В качестве справочного материала могу рекомендовать онлайн-справочник http://htmlbook.ru, который, при желании, можно скачать, используя wget ;)


Автор: Игорь Новиков

Share this story:
  • tweet

Tags: HTML

Recent Posts

  • Blender делает первый большой шаг к 3D-печати

    17.05.2013 - 4 Comments
  • Выпущена стабильная версия colord

    14.05.2013 - 0 Comment
  • Кисти SAI портированы в MyPaint, в Krita перенесены фигуры Alchemy

    13.05.2013 - 2 Comments

No Responses to “Черновая конвертация текста в HTML”

Leave a Reply Cancel Reply

Your email address will not be published. Required fields are marked *

*
*


На связи

Хотите быть в курсе новостей о работе с мультимедиа в Linux? Подпишитесь на наш RSS или аккаунт в Twitter.

RSSSubscribe

Свежие комментарии

  • Знакомимся с бетой Lightworks для Linux

    Интересно, а кто-нибудь...
    18.05.2013 - Игорь
  • Blender делает первый большой шаг к 3D-печати

    Пока готовил материал, как раз...
    17.05.2013 - Александр Прокудин
  • Blender делает первый большой шаг к 3D-печати

    Ну в общем да но и удобного...
    17.05.2013 - Valber
© 2013. Все права защищены.