Студопедия
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Программы-переводчики. Возможности систем распознавания текстов

Читайте также:
  1. DSM — система классификации Американской психиатрической ассоциации
  2. EIS и DSS системы.
  3. ERP-система
  4. GRID- системи
  5. I Объективные характеристики (потребление материальных благ; продолжительность жизни; система образования; время труда; показатель преступности);
  6. I. Общеметодологические (общесистемные) принципы.
  7. I. Судебно-следственная практика формирования системы доказательств по уголовному делу (постановка проблемы).
  8. I.1. Инновационный подход к системе освоения ценностей физической культуры и спорта.
  9. ICQ - это способ общения в сети, который позволяет вести беседу с любым зарегистрированным в системе ICQ и подключенным в данный момент к Интернету пользователем.
  10. Internet/Intranet-технологии в корпоративных информа­ционных системах.

 

Пользователь довольно часто сталкивается с тем, что ему нужно оперативно перевести на родной язык (или с родного на иностранный) ту или иную фразу или небольшой фрагмент текста. Чаще всего это нужно при составлении писем, заявлений, при чтении инструкций, руководств, новостей и другой информации. Несомненно, иностранный язык многие из нас изучали в школе или в институте, поэтому при достаточном объеме времени справиться с задачей будет несложно. Однако при работе в Интернете несколько минут практически всегда имеют значение. Очевидно, что такой перевод должен происходить быстрее, чем с бумажным словарем. Для этого существуют специальные приложения и сервисы — программы-переводчики для настольных компьютеров и мобильных устройств, а также веб-сервисы перевода.
Сегодня существует большое количество программ-переводчиков, как локально устанавливаемые на компьютере, так и on-lain переводчики в сети Интернет. Например, к бесплатным программам, которые можно скачать и установить на локальном компьютере, относятся: qDictionary,Словари Школьника,MultiTranse и др.
Если же нет проблем с Интернетом, то под рукой есть огромный выбор онлайн-переводчиков. Переводчик может быть реализован как в виде приложения, так и в виде веб-сервиса. В первом случае он напоминает текстовый редактор, к которому подключены специальные инструменты, отвечающие за настройку перевода с базами данных по каждому языку. Такая программа может интегрироваться с другими приложениями на компьютере, например, с редакторами из Microsoft Office, онлайн-мессенджерами, веб-браузерами, что позволяет получать перевод непосредственно в этих приложениях без необходимости копирования фрагмента текста в переводчик, причем с сохранением форматирования и структуры текста.
В мире лидирует сервис переводов Google — Google Translate. В нем значительно больше направлений переводов, но отсутствуют тематики. Поле для ввода текста поддерживает очень большие фрагменты текста, к тому же сервис умеет переводить сайты — для этого можно просто скопировать в строку ввода URL-ресурса или установить расширение/панель для браузера. Из-за открытой технологии разработчики создали достаточно большое количество бесплатных клиентов для перевода через Google как для десктопов, так и для смартфонов и коммуникаторов, помимо фирменного мобильного приложения от Google. Интересно, что в Google Translate можно предложить свой вариант перевода.
Также можно использовать переводчики, предложенные компанией Yandex - http://translate.yandex.ru/. Аналогично, можно воспользоваться услугой перевода на сайте Dnevnik.ru для зарегистрированных пользователей.


36) Технологии работы с текстовыми документами. Текстовые редакторы и процессоры: назначение и возможности. Основные структурные элементы текстового документа. Шрифты, стили, форматы. Основные приемы редактирования документа. Встраиваемые объекты. Понятие гипертекста.

Текстовые редакторы Для обработки текстовой информации на компьютере используются приложения общего назначения - текстовые редакторы. Текстовые редакторы — это программы для создания, редактирования, форматирования, сохранения и печати документов. Современный документ может содержать, кроме текста, и другие- объекты (таблицы, диаграммы, рисунки и т. д.). Простые текстовые редакторы (например, Блокнот) позволяют редактировать текст и осуществлять простейшее форматирование шрифта. Более совершенные текстовые редакторы, имеющие целый спектр возможностей по созданию документов (например, поиск и замена символов, средства проверки орфографии, вставка таблиц и др.), называют иногда текстовыми процессорами. Примером такой программы является Word из офисного пакета MicrosoftOffice, или Writer из пакета StarOffice. Мощные программы обработки текста — настольные издательские системы — предназначены для подготовки документов к публикации. Пример подобной системы — Adobe PageMaker. Для подготовки к публикации в Интернете web-страниц используют специализированные приложения (например, Microsoft FrontPage или Macromedia Dreamweaver). Основные элементы текстового документа Текст документа текстового редактора содержит следующие элементы: символ (минимальная единица текстовой информации); слово (любая последовательность символов, ограниченная с обоих концов служебными символами. Служебный символ - это пробел, точка, запятая, дефис и т.д.); предложение (любая последовательность символов между двумя точками); строка (любая последовательность символов между левой и правой границами абзаца); абзац (любая последовавтельность символов, замкнутая символом Возрат каретки -). Редактирование и форматирование Редактирование — преобразование, обеспечивающее добавление, удаление, перемещение или исправление содержания документа. Редактирование документа обычно производится путем добавления, удаления или перемещения символов или фрагментов текста. Объектно-ориентированный подход дает возможность реализовать механизм встраивания и внедрения объектов (OLE — Object Linking Embedding). Этот механизм позволяет копировать и вставлять объекты из одного приложения в другое. Например, работая с документом в текстовом редакторе Word, в него можно встроить изображения, анимацию, звук и даже видеофрагменты и таким образом из обычного текстового документа получить мультимедиа-документ. Форматирование — преобразование, изменяющее форму представления документа. Любой документ состоит из страниц, поэтому в начале работы над документом необходимо задать значения параметров страницы: формат, ориентацию, поля и др. Стандартным является формат страницы А4 (21х29,7 см). Существуют две возможные ориентации страницы – книжная и альбомная. Для обычных текстов чаще используется книжная ориентация, а для таблиц с большим количеством столбцов – альбомная. Форматирование абзацев. Абзац с литературной точки зрения – это часть текста, представляющая собой законченный по смыслу фрагмент произведения, окончание которого служит естественной паузой для перехода к новой мысли. В компьютерных документах абзацем считается любой текст, заканчивающийся управляющим символом конца абзаца. Ввод конца абзаца обеспечивается нажатием клавиши ВВОД (ENTER). Форматирование абзацев позволяет подготовить правильно и красиво оформленный документ. В процессе форматирования абзаца задаются параметры его выравнивания (выравнивание отражает расположение текста относительно границ полей страницы), отступы (абзац целиком может иметь отступы слева и справа) и интервалы (расстояние между строк абзаца), отступ красной строки и др. Форматирование шрифта (символов). Символы – это буквы, цифры, пробелы, знаки пунктуации, специальные символы. Символы можно форматировать (изменять их внешний вид). Среди основных свойств символов можно выделить следующие: шрифт, размер, начертание и цвет. Шрифт – это полный набор символов определенного начертания. Каждый шрифт имеет своё название, например Times New Roman, Arial, Comic Sans MS. Единицей измерения шрифта является пункт (1 пт = 0,367 мм). Размеры шрифтов можно изменять в больших пределах. Кроме нормального (обычного) начертания символов обычно применяют полужирное, курсивное, полужирное курсивное. По способу представления в компьютере различаются шрифты растровые и векторные. Для представления растровых шрифтов служат методы растровой графики, символы шрифта — это группы пикселей. Растровые шрифты допускают масштабирование только с определенными коэффициентами. В векторных шрифтах символы описываются математическими формулами и возможно произвольное их масштабирование. Среди векторных шрифтов наибольшее распространение получили шрифты типа TrueType. Можно также установить дополнительные параметры форматирования символов: подчеркивание символов различными типами линий, изменение вида символов (верхний и нижний индекс, зачеркнутый), изменение расстояний между символами. Если планируется цветная печать документа, то можно задать различные цвета для различных групп символов. Проверка орфографии и синтаксиса Для проверки орфографии и синтаксиса используются специальные программные модули, которые обычно включаются в состав текстовых процессоров и издательских систем. Такие системы содержат словари и грамматические правила для нескольких языков, что позволяет исправлять ошибки в многоязычных документах. Формат файла Формат файла определяет способ хранения текста в файле. Простейший формат текстового файла (ТХТ) содержит только символы (числовые коды символов), другие же форматы (DOC, RTF) содержат дополнительные управляющие числовые коды, которые обеспечивают форматирование текста.

 


 


37) программные седства и техналогия обработки текстовой информации

Стремление упростить работу с различными видами текстов (служебными бумагами, конспектами лекций, газетами, журналами, книгами и т. д.)привело к созданию большого количества программного обеспечения, ориентированного на решение этих проблем и называемого текстовым редакторами (ТР) или текстовыми процессорами.
Все электронные документы требуют ввода и редактирования, но форматирование документа не всегда является обязательным. Более того, форматирование текстового документа во многих случаях вредит делу, поскольку информация о форматировании заносится в текст в виде невидимых кодов. Наличие подобных кодов может мешать определённым программам работать с текстами.
Таким образом, исторически сложилась ситуация, при которой некоторые документы требуют форматирования, а некоторые - нет. Оказалось удобным иметь различные программы: одни из них используются только для ввода и редактирования текста, а другие позволяют также его форматировать. Первые программы называют ТЕКСТОВЫМИ РЕДАКТОРАМИ, а вторые ТЕКСТОВЫМИ ПРОЦЕССОРАМИ.
Среди профисиональных ТР наибольшее распространение получили «Лексикон», ChiWriter, Multiedit, Microsoft Word, TeX. Имеется значительное число разнообразных ТР для школьных компьютеров (например, для УКНЦ это Edit, Writer).
Общее назначение ТР- ввод текстов в компьютер и их редактирование, сохранение на ВЗУ и печать на бумаге.
Всякий текст- это последовательность символов.
Символьный алфавит компьютера содержит 256 знаков. Один символ занимает 1 байт. Все символы в алфавите пронумерованы от 0 до 256. Каждому номеру соответствует 8- разрядный двоичный код от 00000000 до 11111111. Этот код просто номер символа в двоичной системе счисления. Таблицу, в которой ставятся в соответствие символы, их десятичные номера и двоичные коды, называется таблицей кодировки. Наиболее распространенной таблицей на персональных компьютерах является код ASCII. Не все коды отображаются на экране в виде символов. Некоторые являются управляющими- управляют печатью или выводом на экран.
Простейшие ТР сохраняют тексты в форме текстовых файлов. Текстовый файл состоит только из символов, входящих в таблицу кодировки (1 символ- 1байт). Текст разбит на строки. Каждая строка заканчивается кодом конца строки.
Обычная пишущая машинка может печатать только единственным шрифтом. В текстовом документе, созданном на компьютере с помощью ТР, могут использоваться разнообразные шрифты. Современные текстовые редакторы имеют достаточно большие наборы шрифтов. У каждого шрифта есть свое название. Например: Arial, Times New Roman, Serif и др. Буквы одного шрифта могут иметь разные начертания. Различаются обычное (прямое) начертание, курсив, полужирное начертания. Кроме того, представляется возможность подчеркивания текста. Вот несколько примеров:

Текстовые редакторы дают возможность управлять размером символов.
Следует иметь в виду, что если ТР позволяет менять шрифты, начертания и размеры, то в памяти приходится хранить не только коды символов, но и указание на способ их изображения. Это увеличивает размер файла с текстом. Информацию о шрифтах воспринимают программы, управляющие выводом текста на экран или на печать. Именно они и создают изображение символов в нужной форме.
Практически все редакторы, распространенные в нашей стране, позволяют использовать как русский, так и латинский алфавит.
This is example of English text.
Современные ТР дают возможность пользователю работать одновременно с несколькими текстовыми документами, используя многооконный режим. В многооконном режиме ТР выделяет для каждого документа отдельную область памяти, а на экране- отдельное окно. Окна на экране могут располагаться каскадом (друг за другом) или мозаикой (параллельно в плоскости экрана). Активным окном является то, в котором в данный момент находится курсор.
С помощью специальных команд (нажатия определенных клавиш) производится переход от одного активного окна к другому. При этом можно переносить или копировать фрагменты текста из одних документов (окон) а другие.
Среда ТР
Рабочие поле ТР это экран дисплея, на котором отображаются все действия, выполняемые ТР. Важным элементом среды ТР является интерфейс- это те средства, с помощью которых пользователь может общаться с ТР и управлять им. На сегодняшний день наиболее предпочтительным является интерфейс в форме меню, из которого специальным маркером (выделенным цветом) можно выбрать те или иные команды ТР.
Одновременно с меню на экране высвечивается строка состояния, в которой дается информация о текущем состоянии ТР (режим работы, позиция курсора и пр.).
Текст, обрабатываемый с помощью ТР, хранится в оперативной памяти и визуально может быть представлен в виде рулона бумаги (разделенного на страницы в некоторых ТР), длина и ширина которого в большинстве случаев не позволяют целиком наблюдать его на экране.
Таким обрезом, экран можно считать своеобразным окном, через которое пользователь просматривает текст.
Для перемещения этого окна по тексту используется специальные клавиши. Есть ТР, позволяющие открывать несколько таких окон «над» соответствующим количеством текстов.
Кроме основной памяти (рулона), где ТР хранит обрабатываемый текст, в его расположении находятся ряд дополнительных листов памяти, к которым относятся лист удаленных строк, буфер («карман») для хранения копируемых фрагментов текста, справочник (подсказка, или help), словарь.
Курсор- световое пятно на экране- место активного воздействия на рабочее поле. Передвигая курсор, можно перемещать окно по основной памяти (тексту). Наличие курсора в рабочем поле указывает на то, что исполнитель находится в режиме ввода – редактирования текста.
Координаты курсора в тексте (или на страницы)- номера строки и столбца- отображается в строке состояния.
Режим работы ТР.
1. Ввод - редактирование текста.
Состояние ТР, находящегося в этом режиме, отражается в строке состояния. Отметим основные компоненты состояния:
координаты курсора,
вставка/удаление,
строчные/заглавные (нижний/верхний регистр),
шрифт (рус./лат.),
разметка строки (абзац, разрешенное число символов),
выравнивание текста по краям или по центру,
перенос.
2. Форматирование.
Работа в этом режиме позволяет скомпоновать текст (фрагмент текста) в требуемом виде, установив отступы, красную строку, число позиций в строке и т. д.
3. Обращение за подсказкой.
При переходе в этот режим на экране открывается дополнительное справочное окно, содержащее краткую справочную информацию о работе в ТР. Подсказка может содержать несколько листов текста, в этом случае указывается способ перелистывания.
4. Орфографическая проверка.
Этот режим работы возможен лишь при наличии словаря. При проверке текста фиксируются слова, отсутствующие в словаре, что является косвенным свидетельством орфографической ошибки. Режим орфографической проверки может быть совмещен с режимом редактирования.
5. Обмен с ВЗУ.
Возможен в двух направлениях:сохранение (запись, или save) и загрузка (считывание, или load) текста, который при хранении на ВЗУ называется файлом (текстовым файлом). При этом указывается путь к необходимому каталогу.
6. Печать.
В этом режиме осуществляется вывод текста на бумагу. С помощью ТР можно управлять принтером, определив шрифт, вид печатаемой страницы (поля, число строк), способ нумерации страниц.

Система команд ТР.

Систему команд ТР можно условно разделить на следующие группы команд:
• Команды интерфейса - вход в меню и выход из него, перемещение маркера по меню, выбор нужного пункта меню;
• Команда изменения состояния ТР, позволяющие в режиме редактирования вобрать шрифт, нижний/верхний регистр, режим вставки/замены и т. д.;
• Команда перемещения по тексту, которые разделяются на две групп: пошаговое перемещение (стрелки вправо, влево, вверх, вниз) и быстрое перемещение по тексту (переход в начало/конец строки, текста, листание страниц и т. д.);
• Команды посимвольного редактирования, позволяющие внести исправления в текст (вставить, удалить, заменить символ и т. д.);
• Команда работы со строками, позволяющие манипулировать со строками (удалить, вставить, рассечь на две, «склеить»);
• Поиск по образцу служит для отыскания в тексте мест, содержащих указанный набор символов (букву, слово, фразу и т. д.);
• Копирование включает в себя выделение копируемого фрагмента текста и помещением его в буфер, воспроизведение содержимого буфера в требуемом месте текста;
• Форматирование позволяет придать тексту требуемый вид: установить число символов в строке, выровнять по краям, выделить поля и красную строку и т. д.

В большинстве ТР команды можно выполнить двумя способами:
1. С помощью функциональных и управляющих клавиш;
2. Выбором пунктов меню.

Настольные издательские системы относятся к средствам автоматизированного проектирования. Они предназначены для автоматизации подготовки документов к изданию, то есть к размножению и распространению.
В связи с широким распространением в последние годы мультимедийных и сетевых электронных изданий, ныне принято различать НАСТОЛЬНЫЕ ИЗДАТЕЛЬСКИЕ СИСТЕМЫ (для подготовки полиграфических изданий) и СИСТЕМЫ ВЁРСТКИ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ.
Наиболее популярными издательскими системами являются QuarkXPress PageMarker.
Основным отличием настольных издательских систем от текстовых редакторов и процессоров является то, что они предназначены в первую очередь для оформления документа, а не для ввода текста и проверки правописания, хотя в определённой степени могут выполнять и эти функции.
Процесс вёрстки документа состоит в оформлении текста и задании условий взаимного расположения текста и иллюстраций. Целью вёрстки является создание оригинал-макета, пригодного для размножения документа полиграфическими методами.
Работа с ситемой компьютерной вёрстки во многом напоминает наклейку аппликации на бумагу. Сначала заготавливают отдельные объекты, а затем раскладывают их на чистом листе. Художественный эффект достигается гармоничным взаимным расположением различных элементов оформления.
Объектами, с которыми работают издательские системы, являются: блоки текста, рисунки и стандартные элементы оформления, например линии. Стандартные элементы можно вставить средствами самой системы, а тексты и рисунки готовят заранее. Для подготовки текстов применяют текстовые процессоры, а для подготовки рисунков - графические редакторы.

2.Задача. Вычисление арифметического выражения с данными, представленными в двоичной системе счисления.
Выполните вычисления:

1110+101

10101-11
Решение:




Дата добавления: 2015-01-30; просмотров: 209 | Поможем написать вашу работу | Нарушение авторских прав

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | <== 39 ==> |


lektsii.net - Лекции.Нет - 2014-2025 год. (0.009 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав