Курсовая: Трансформация XML документов - текст курсовой. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Курсовая

Трансформация XML документов

Банк рефератов / Программирование

Рубрики  Рубрики реферат банка

закрыть
Категория: Курсовая работа
Язык курсовой: Русский
Дата добавления:   
 
Скачать
Microsoft Word, 559 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникальной курсовой работы

Узнайте стоимость написания уникальной работы

Министерство образования Российской Федерации Саратовский государств енный университет Имени Н.Г . Чернышевского Кафедра мат моделирования процессов и систем управления Трансформа ция XML документов Наименование курсовой работы ___________________________________________________________________________ прописными буквами КУРСОВАЯ РА БОТА Студента 4 курса механико-математического факультета _____________________ Фроолова Николая Васильевича ___________________ Ф амилия , имя отчество Научный руко водитель Доцент , к.ф.м.н . Ковалев А.Д. Должность , уч степень подпись , дата инициалы , фамили я Зав . Кафедрой Доцент , к.ф.м.н . Мозжи лкин В.В. подпись , дата САРАТОВ 2003 Сарат овский государственный университет Имени Н.Г . Чернышевского УТВЕРЖДЕНО На заседании кафедры мат м оделирования процессов и систем управления протокол от г ЗАДАНИЕ НА КУСОВУЮ РАБОТУ По специальн ости 010200______________ Шифр Тема ___________ Трансформация XML документов ________________ Наименование курсовой работы __________________________________________________ прописными буквами Студента 4 курса ме ханико-математического факультета _____________________ Фроолова Николая Васильевича ___________________ Фамилия , имя отчество Перечень вопросов , подлежащих разработке в курсовой работе : 1 . Моделирование XML - документов 2. Структура XML -документа 3. Documents Type Definitions ( DTD ) 4. Схемы данных Дата выдачи ____________________________________________________ Число , месяц Срок выполнения ______________________________________________ Число , месяц Преподаватель Доцент , к.ф.м.н . Кова лев А.Д. Д олжность , уч степень подпись , дата инициалы , фамилия Содержание 1. Введение 2. Структура XML -документа 3. Моделирова ние XML - док ументов 4. Documents Type Definitions (DTD) 5. Схемы данных 6. Иллюстрационный пример 1. Введение. За недолгое время своего официального существования язык XML привлек к себе уже достаточно много внимания со стороны раз работчиков и пользователей Интернет . Сего дня количество приверженцев этой новой технол огии возрастает очень стремительно . Несмотря на то , что XML очень молод (международная орг анизация W3C утвердила спецификацию "Extensible Markup Language(XML) 1.0" в нач а ле февраля 1998 г ) и отдельные ко мпоненты этого языка находятся еще в стад ии доработки , уже сегодня появляются новые языки , созданные на основе XML, возникают много численные Web-сервера , использующие эту технологию для организации хранящейся на них информ а ции . Когда осенью 1991 года Интернет впервые услышал о новой технологии , под названием WWW , почти ник то не мог представить себе , что завоевания ее окажутся настолько глобальными . Сегодня для многих пользователей слово Интернет пр очно ассоциируется с WWW и с уст специ алистов не сходит тема будущего информационны х систем и влияния на это будущее все мирной сетевой паутины . Популярность World Wide Web и неотъемлемой ее ча сти , HTML, безусловно , стала причиной повышенного в нимания к системам гипер текстовой разметк и документов . Хотя понятие гипертекста было введено В.Бушем еще в 1945 году и , начиная с 60-х годов стали появляться первые п риложения , использующие гипертекстовые данные , всп леск активности вокруг этой технологии началс я лишь тогда , когд а возникла реа льная необходимость в механизме объединения м ножества информационных ресурсов , обеспечения воз можности создания , просмотра нелинейного текста . И примером реализации этого механизма посл ужила паутина WWW. Язык разметки документов - это н абор специальных инструкций , называемых тэгами , предназначенных для формирования в документах какой-либо структу ры и определения отношений между различными элементами этой структуры . Тэги языка , ил и , как их иногда называют , управляющие дес крипторы , в таки х документах выделяю тся относительно основного содержимого документа и служат в качестве инструкций для п рограммы , производящей показ содержимого документ а на стороне клиента . В самых первых с истемах для обозначения этих команд использов ались символы “ <” и “ >” , вн утри которых помещались названия инструкций и их параметры . Сейчас такой способ обознач ения тэгов является стандартным . Использование гипертекстовой разбивки тек стового документа в современных информационных системах во многом связано с тем , что гипертекст позволяет создавать механизм н елинейного просмотра информации . В таких сист емах данные представляются не в виде непр ерывного потока текстовой информации , а набор ом взаимосвязанных компонентов , переход по ко торым осуществляется при помощи ги п ерссылок . Самый популярный на сегодняшний день язык гипертекстовой разметки – HTML, был со здан специально для организации информации , р аспределенной в сети Интернет , и является одной из ключевых составляющих технологии WWW. С использованием гипертек стовой модели док умента способ представления разнообразных информ ационных ресурсов в сети стал более упоря дочен , а пользователи получили удобный механи зм поиска и просмотра нужной информации . HTML является упрощенной версией стандартного общего яз ыка разметки - SGML (Standart Generalised Markup Language), который был утвержден ISO в качестве стандарта еще в 80-х годах . Этот язык предназначен для создания других языков разме тки , он определяет допустимый набор тэгов , их атрибуты и внутреннюю структу р у документа . Контроль над правильностью использования дескрипторов осуществляется при помощи специального набора правил , называемых DTD-описаниями , которые используются программой клие нта при разборе документа . Для каждого кла сса документов определяется с в ой набор правил , описывающих грамматику соответствую щего языка разметки . С помощью SGML можно опи сывать структурированные данные , организовывать и нформацию , содержащуюся в документах , представлять эту информацию в некотором стандартизованном формате . Но в виду некоторой с воей сложности , SGML использовался , в основном , для описания синтаксиса других языков (наиболее известным из которых является HTML), и немног ие приложения работали с SGML- документами напрям ую . Гораздо более простой и удобный , ч ем SGM L, язык HTML позволяет определять оформлени е элементов документа и имеет некий огран иченный набор инструкций - тэгов , при помощи которых осуществляется процесс разметки . Инстру кции HTML, в первую очередь , предназначены для управления процессом вывода соде р ж имого документа на экране программы-клиента и определяют этим самым способ представления документа , но не его структуру . В каче стве элемента гипертекстовой базы данных , опи сываемой HTML, используется текстовый файл , который может легко передаваться по се т и с использованием протокола HTTP. Эта ос обенность , а также то , что HTML является откры тым стандартом и огромное количество пользова телей имеет возможность применять возможности этого языка для оформления своих документо в , безусловно , повлияли на рост поп у лярности HTML и сделали его сегодня главн ым механизмом представления информации в Web. Однако современные приложения нуждаются не только в языке представления данных на экране клиента , но и в механизме , позволяющем определять структуру документа , оп исывать содержащиеся в нем элементы . HTML обладает несложным набором команд и вполне успешно справляется с задачей описания т екстовой информации и отображением ее на экране программы просмотра - браузера . Однако с ами отображаемые данные никак не связаны с теми тэгами , которые используются для форматирования , поэтому у программ-анализат оров нет возможности использовать тэги HTML для поиска нужных нам фрагментов документа . Т .е . встретив , например , такое описание < font color =" red "> rose программа просмо тра будет знать , каким цветом отобразить текст , содерж ащийся внутри тэгов и , вероятно , отобразит его правильно , но ей абсолютно безразличн о , в каком месте документа встретился этот тэг , в какие другие тэги заключен тек ущий фрагмент , существу ю т ли вложе нные в него фрагменты , правильно ли постро ены отношения между объектами . Такое "безразли чие " к структуре документа приводит к тому , что поиск или анализ информации внутри него ничем не будет отличаться от ра боты со сплошным , не разбитым на элеме н ты текстовым файлом . А это , ка к известно , не самый эффективный способ ра боты с информацией . Другим существенным недостатком HTML можно назвать ограниченность набора его тэгов . DTD-п равила для HTML определяют фиксированный набор д ескрипторов и поэтом у у разработчика нет возможности вводить собственные , специальные тэги . Хотя время от времени появляются новые расширения языка , но долгий путь их стандартизации , сопровождаемый постоянными раз ногласиями между основными производителями брауз еров делают пр а ктически невозможной быструю адаптацию языка , его использование для отображения специализированной информации ( например , мультимедийной , математических , химических формул и т.д .). Подводя итог всему сказанному , можно утверждать , что HTML уже сегодня не удо влетворяет в полной мере требованиям , предъяв ляемым современными разработчиками к языкам п одобного рода . И ему на смену был пред ложен новый язык гипертекстовой разметки , мощ ный , гибкий , и , одновременно с этим , удобный язык XML. XML ( Extensible Markup Language ) - это язык разметки , описывающий целый класс объект ов данных , называемых XML-документами . Этот язык используется в качестве средства для опи сания грамматики других языков и контроля над правильностью составления документов . Т.е . сам по се бе XML не содержит никаких тэгов , предназначенных для разметки , он прос то определяет порядок их создания . Таким о бразом , если , например , мы считаем , что для обозначения элемента rose в документе необходимо использовать тэг ; то XML позво ляет свобод но использовать определяемый н ами тэг и мы можем включать в докумен т фрагменты , подобные следующему : rose Набор тэгов может быть легко расширен . Если , предположим , мы хотим такж е указать , что описание цветка должно по смыслу идти внутри описания оранжереи , в которой он цветет , то просто задаем новые тэги и выбираем порядок их сле дования : < conservatory > < flower > rose Процесс создания XML документа очен ь прост и требует лишь базовых знаний HTML и понимания тех задач , которые необх одимо выполнить , используя XML в качестве языка разметки . Таким образом , у разработчиков появляется уникальная возможность определять соб ственные команды , позволяющие им наиболее эфф ективно определять данные , содержащиеся в док ументе . Автор документа создает его структуру , строит необходимые связи между э лементами , используя те команды , которые удовл етворяют его требованиям , и добивается такого типа разметки , которое необходимо ему для выполнения операций просмотра , поиска , анализ а документа. Еще одним из очевидных достоинств XML является возможность использования его в качестве универсального языка запросов к хран илищам информации . Сегодня в W3C находится на рассмотрении рабочий вариант стандарта XML-QL(или XQL), который , возможно , в б удущем составит серьезную конкуренцию SQL. Кроме того , XML-документ ы могут выступать в качестве уникального способа хранения данных , который включает в себя одновременно средства для разбора инф ормации и представления ее на стороне кли ента . В этой области одним из п ерспективных направлений является интеграция Java и XML - технологий , позволяющая использовать мощь о беих технологий при построении машинно-независимы х приложений , использующих , кроме того , универс альный формат данных при обмене информации . XML позволяет также осуществлять кон троль над корректностью данных , хранящихся в документах , производить проверки иерархических соотношений внутри документа и устанавливать единый стандарт на структуру документов , со держимым которых могут быть самые раз л ичные данные . Это означает , что его можно использовать при построении сложных информационных систем , в которых очень важным является вопрос обмена информацией между различными приложениями , работающими в одной системе . Создавая структуру механизма обмена и нформации в самом начале работы над проектом , менеджер может избавить себ я в будущем от многих проблем , связанных с несовместимостью используемых различными к омпонентами системы форматов данных . Также одним из достоинств XML является то , что програм мы-обработчики XML-документов не сложны и уже сегодня появились и свободно распространяются всевозможные программные продукты , предназначенные для работы с XML-д окументами . XML поддерживается в IE5. Было заявлено о его поддержке в последующих версиях Nets c ape Communicator, СУБД Oracle, DB-2, в приложениях MS-Office. Все это дает основания предполагать , что , ско рее всего , в ближайшем будущем XML станет осн овным языком обмена информации для информацио нных систем , заменив собой , тем самым , HTML. На основе XML уже сегодня созданы та кие известные специализированные языки разметки , как SMIL, CDF, MathML, XSL, и список рабочих проектов новы х языков , находящихся на рассмотрении W3C, постоя нно пополняется . 2. Структура XML -документа Хотя XML, сильно отли чается по своим возможностям и предназначению о т языка гипертекстовой разметки , оба эти я зыка являются подмножествами SGML, и , следовательно , наследуют его базовые принципы . Простейший XML - документ может выглядеть так : Первый Второй подпункт 1 Третий Последний Этот документ очень похож на обычную HTML-страницу . Так же , как и в HTML, инструкции , заключенные в угловые скобки называются тэгами и служат для разметки основного текста документа . В XML существуют открывающие , закрывающие и пустые тэги (в HTML понятие пустого тэга тоже существует , но специального его обозначения не требуется ) . Тело документа XML состоит из элементов разметки ( markup ) и непосредственно содержимого документа - данных ( content ). XML - тэги предназначены для определения элементов документа , их атрибутов и других конструкци й языка . Любой XML-документ до лжен всегда начинаться с инструкции , внутри которой также можно задавать номер версии языка , номер кодовой страницы и другие параметры , необходимые программе-анализатору в процессе разбора документ а. В общем случае XML-документы должны у довлетворять следующим требованиям : · В заголовке док умента помещается объявление XML, в котором указ ывается язык разметки документа , номер его версии и дополнительная информация ; · Каждый открывающий т эг , определяющий некоторую область данных в документ е обязательно должен иметь зак рывающий тэг ; · В XML учитывается регис тр символов ; · Все значения атрибут ов , используемых в определении тэгов , должны быть заключены в кавычки ; · Вложенность тэгов в XML строго контролируется , поэтому необходимо с ледить за порядком следования открывающих и закрывающих тэгов ; · Вся информация , распо лагающаяся между начальным и конечными тэгами , рассматривается в XML как данные , и поэтому учитываются все символы форматирования (т.е . пробелы , переводы строк , табуляции не игно рируются , как в HTML). Если XML-документ не нарушает приведенные правила , то он называется формально-правил ьным и все анали заторы , предназначенные для разбора XML- документов , смогут работать с ним корректно . Однако кроме проверки на формальное соотв етст вие грамматике языка , в документе могут пр исутствовать средства контроля над содержанием документа , за соблюдением правил , определяющих необходимые соотношений между элементами и формирующих структуру документа . Для того , чтобы обеспечить проверку кор р ектн ости XML- документов , необходимо использовать анализа торы , производящие такую проверку и называемы е верифицирующими . На сегодняшний день сущест вует два способа контроля правильности XML-докум ента : DTD - определения (Document Type Definition) и схемы дан ных (Semantic Schema) . В отличии от SGML, определение DTD-правил в XML не является необходимостью. Конструкции языка Содержимое XML-документа представляет собой набор элементов , секций CDATA, директив ан ализатора , комментариев , спецсимволов , текстовых да нных . Элементы данных Элемент - это струк турная единица XML-документа . Заключая слово rose в в тэги < flower > , мы определяем непустой элемент , называемый , со держимым которого является rose . В общем случае в качестве содержимого элемент ов могут выст упать как просто какой-то текст , так и другие , вложенные , элементы документа , секции CDATA, инструкции по обработке , комментарии , - т.е . пр актически любые части XML-документа . Любой непус той элемент должен состоять из начального , конечного тэ г ов и данных , между ними заключенных . Например , следующие фрагмен ты будут являться элементами : < flower > rose < city >Saratov Набором всех элементов , содержащихся в документе , за дается его структура, и определяются все иерархическое соотн ошени я . Плоская модель данных превращаетс я с использованием элементов в сложную ие рархическую систему с множеством возможных св язей между элементами . Производя в последстви и поиск в этом документе , программа клиент а будет опираться на информацию , заложенную в е го структуру - используя элемен ты документа . Поиск при этом , естественно , будет гораздо более эффективен , чем нахождени е нужной последовательности по всему документ у . В XML документе , как правило , определяется хотя бы один элемент , называемый корневым и с него программы-анализаторы начинаю т просмотр документа . В некоторых случаях тэги могут изменять и уточнять семантику тех или иных фрагментов документа , по разн ому определяя одну и ту же информацию и тем самым предоставляя приложению-анализатору этого доку м ента сведения о к онтексте использования описываемых данных . Наприм ер , прочитав фрагмент Holliwood мы можем догадаться , что речь в этой части документа идет о городе , а вот во ф рагменте < restaurant > Holliwood - о забегаловке . В случ ае , если элемент не имеет содержимого , т.е . нет данных , которые он должен определять , он называется пустым . Примером пустых элеме нтов в HTML могут служить такие тэги HTML, как
,
, . Комментарии Комментариями является любая область данны х , заключенная между последовательностям и символов Комментарии пропускаются анал изатором и поэтому при разборе структуры документа в качестве значащей информации не рассматриваются . Атрибуты Если при определении элементов необхо димо зада ть какие-либо параметры , уточняющ ие его характеристики , то имеется возможность использовать атрибуты элемента . Атрибут - это пара "название " = "значение ", которую надо за давать при определении элемента в начальном тэге . Пример : #ff08ff white или Ivan Petrov Специальные символы Для того , чтобы включить в докумен т символ , используемый для определения каких-л ибо конструкций языка (например , символ углово й скобки ) и не вызвать при этом ошибок в процессе разбора такого документа , нужно использовать его специальный символьный либо числовой идентификатор . Например , < , > " и ли $(десятичная форма записи ),  (шестнадцатеричная ) и т.д . Строковые обозначения спецси м волов могут определяться в XML документе при помощи компонентов (entity). Директивы анализатора Инструкции , предназначенные для анализато ров языка , описываются в XML документе при по мощи специальных тэгов - ;. Прог рамма клиента использует эти инструкции для управления процессом разбора документа . Наиболее часто инструкции используются при определении типа документа (например , ) или создании пространства имен . CDATA Чтобы задать область до кумента , которую при разбо ре анализатор будет рассматривать как простой текст , игно рируя любые инструкции и специальные символы , но , в отличии от комментариев , иметь возможность использовать их в приложении , нео бходимо использовать тэги . Внутри этого блока можно по м ещать любую и нформацию , которая может понадобится программе - клиенту для выполнения каких-либо действий (в область CDATA, можно помещать , например , инструкц ии JavaScript). Естественно , надо следить за тем , чт обы в области , ограниченной этими тэгами н е был о последовательности символов ]]. 3. Моделирование XML -документов Одним из наиболее сильных свойств XML является возможность созд авать собственные языки разметки , в которых определяются элементы и атрибуты , наилучшим образом соответствующие инкапсу лируемой ин формации , и снимаются ограничения , вызываемые малопригодным языком общего назначения . Однако пока нельзя определить язык формальным обр азом , ограничить словарь элементов и атрибуто в поддающимся управлению множеством и управля ть грамматикой элем е нтов . Процесс формального определения языка в XML называется моделированием документов . На сегодняшний день существует два способа моделирования документов : определен ия типа документа ( DTD ) , которые описывают структуру документа с помощью декларативных п ра вил , и XML Schema , описывающую структуру документа на примере с помощью шаблонов элементов. Модель определяет документы , которые м ожно создать с помощью языка ; или , в ра мках терминологии XML , модель документа устанавливает , какие д окументы согласуются ( conform ) с языком. Модель документа отвечает на та кие вопросы , как «Может ли быть заголовок у данного элемента ?» или «Должна ли быть указана цена для этого элемента ?» Модель является документом особого рода , написанным по правилам синтаксиса , предназна че нного для описания языков XML , и явно описыв ает грамматику и словарь отдельного языка разметки . Иногда язык , который она описывает , называют типом документа ( document type ) или приложением XML ( XML application ) . С помощью такой модели можно опред елить , сог ласуется ли некоторый документ XML с данны м типом документа. Фактически написанные кем-то документы , на зываемые экземплярами документа ( document instances ) , могут согласоваться с языком , описанным в модели документа или не согласоваться . Со гласующиеся доку менты называют действительными ( valid ) в контексте языка ; другие документы называют н едействительными ( invalid ) . Модель документа может быть лишним грузом , если надо сопровождать лишь один-два документа , но если документов много , а требования к каче ству высоки , ее со здание может окупиться . Вот некоторые ситуаци и , в которых модель документа в состоянии облегчить жизнь :
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
Вчера было совершено дерзкое ограбление музея капитал-шоу "Поле чудес", есть обожравшиеся.
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, курсовая по программированию "Трансформация XML документов", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru