オートノミー・テクノロジー
テクニカル ベネフィット

オートノミーによるXMLのインテリジェンス強化

Extensible Markup Language(XML)は、Web上の構造化ドキュメントおよびデータのユニバーサル フォーマットです。

概要

XMLは、デジタル資料のラベリングやタグ付けの方法として、ますます普及しています。しかし、XMLによってコストを削減し情報管理の効率を上げるには大きな障害があります。この障害に対する認識が不十分であったり、XMLが依存する他の面倒な管理プロセスを自動化する方法を理解していない場合、高い人件費を支払ったうえに記述の一貫性が失われるということになります。

オートノミーは、XMLのタグ付けを自動化して管理することで、これらの障害に対処します。オートノミーは、XMLという車輪を実際に回転させるためのいわば潤滑油です。

XMLとは

XMLは、デジタル情報をラベリングするための記述の標準セットを提供し、資料の迅速な識別およびコンピュータ間のシームレスなデータ交換を自動化するために設計されています。

そのため、XMLは単一で柔軟性のないドキュメント タイプというHTMLの制約を克服し、完全なSGMLが持つ複雑性を回避するように設計されています。最もよく知られているXMLの応用方法は、標準セットの「文書型定義」(DTD)に基づいた情報のマッピング、伝送、およびルーティングを容易にすることによって、非構造化コンテンツのメタデータを構造化するとともに、さまざまなアプリケーションやオペレーティング システム間におけるデータ交換を行うことです。

そのため、XMLは今後のオンライン情報ソースの開発において非常に重要な役割を果たすものと考えられています。しかし、あらゆるタグ付けスキーマと同様、下記のような多くの制限事項の存在が問題となっています。

制限事項

  • 手入力プロセス

    XMLの制限事項として最初にあげられるのは、タグの選択および適用を手入力で行うプロセスです。人手で行なったため生じたことがら、および人が記述した情報(既存の記述であっても)の限界を示す例として、アメリカ国防総省の布告があげられます。国防総省では、ドキュメント作成責任者である省内のユーザーに対し、ドキュメントの内容に関し適切な説明を記述するように指示を出しました。これは、一見したところでは、実用的かつ理にかなった決定のように見えます。しかし、何ヶ月も経ってから、大部分のドキュメントは記述が大雑把で、「一般」というタグが付けられていることが明らかになりました。

    XMLはこういった万能表現からの脱却を目指すものですが、依然として、同じような欠点(「一貫性に欠ける」)を持つ人間の行為に依存しています。情報を記述する各人の能力は、個人の経験、知識、および見解に左右されます。そのような「無形の資産」は、人それぞれ異なり、また状況にもよるため、結果の有効性が大きく損なわれることもあります。

    サブジェクトに複数のテーマが含まれている場合にはさらに面倒な事態が発生します。例えば、「変化する外交政策とロシアにおける技術開発」に関する記事は、(i) ロシアの技術、(ii) ロシアの外交政策、(iii) ロシアの経済のどれに分類すべきでしょうか。それを決定するプロセスは、複雑で時間もかかり、特にユーザーが本当に選択できる数を考慮する場合は、さらなる矛盾を招くこともあります。例えば、一般的な新聞のサブジェクトの場合、タグは800を超えるので、基本的なサブジェクトの記述を選択する作業を妥当な時間内に完了させることは、なおさら困難です。

    概念の距離付けタグでも、サブジェクト間の関係を明らかに示すことはできません。「概念の距離付け」と名付けられているように、例えば、/wing design/low drag/と/aerofoil/efficiency/などのように、関係なくタグ付けされているようにみえるサブジェクトの間に重要な関係があることがよくあります。この例の場合、最初の方のカテゴリには空気抵抗を少なくする翼の設計方法に関する情報が含まれているものと思われます。後の方のカテゴリは、効率性に優れた翼を作る方法に関するものです。明らかに、これらのカテゴリの間にはある程度重複する部分があり、ユーザーは両方のコンテンツに興味を持つかもしれません。しかし、カテゴリ名の意味を理解していなければ、これら2つの間に明らかな相互関係が存在するとは理解されません。

  • 固有性

    XMLベースのドキュメントで的確な検索および処理を行なうためには、必要なタグの数を非常に多くする必要があります。例えば、ロイターなどのような企業の場合、タグの数は数万にものぼります。しかし、タグの数が増えるにつれて、その労力も増え、分類を間違える可能性も高くなります。

  • タグの相互運用

    XMLとは、タグ定義の標準セットではなく、タグを定義できるようにするための定義のセットです。したがって、2つの組織が同一のタグに同一の意味を持たせて相互に使用しようとする場合は、それらのタグの定義について事前に明確な合意が必要になります。

    このような方法はパブリック ネットワークを使用して連携する小規模な共同グループでは有効かもしれませんが、更に広い産業界のパートナー同士のネットワークにおいてもスケーラビリティがあるかどうかは疑問が残ります。

    特に自動車業界などの一部の業種では、相互運用性が不可欠なものとなっています。ジャスト イン タイムの納品方式、ベンダによる在庫管理、サプライ チェーンの統合が始まり、輸送と倉庫保管がより重要になるにつれ、異なる業種間で使用する用語を統一する必要性が増してきました。しかし、分かりやすい相互運用性のあるXMLの仕様を作成するためには、グローバルなビジネス ニーズの理解に基づいた集中的なアプローチが必要になります。

オートノミーとXML

オートノミーのソフトウェアを利用すれば、XMLに関する従来の問題を回避することができます。オートノミーのコア テクノロジによって、コンピュータは非構造化情報を含むページを解釈し、自動的に適切なXMLタグを挿入できるようになるからです。オートノミーは、XMLに完全準拠しているとともに、XMLメタ情報の効率的なオペレーション、作成、変更を可能にします。

オートノミーは、ドキュメントのコンテンツから推測されるカテゴリに基づき、自動的にデータにXMLタグを付けます。このタグによって、情報は再利用、管理され、システムにより自動的に分類されたり適切なユーザーへ自動配信されます。社員や管理者はXMLタグを時間を費やして手入力する必要がなくなるので、開発サイクルの時間と人件費は削減され、人為的ミスによる非効率性は回避されます。

オートノミー:XMLと特定分野への応用

オートノミーとXMLの組み合わせが、サプライ チェーン管理などの分野でより繊細に応用されています。これらの分野では、XMLの長所を利用して製品コードやカタログ番号を正確に記録する時、質的な情報または補足情報を伝えるために、さらに非構造化情報が必要になることがあります。

そのような場合にオートノミーは、タグ自体を自動作成するだけでなく、周辺の関連情報を分析したり処理したりすることができます。例えば、航空機製造会社が多数のコンポーネントの納品の自動化に同意したとします。その後実際にコンポーネントの納品が行なわれ、製造技術、サポート上の問題、または取り付け指示に変更が生じた場合、変更に応じた新情報も考慮しなければならなくなります。一般的にこの時点でサプライ チェーン管理の自動化は暗礁に乗り上げます。というのも、そのような情報は人間が手動で処理しなければならず、最悪の場合は情報が切り捨てられたり、まったく認識されなかったりすることがあるためです。

商取引への応用についても同じような問題がみられます。XMLの使用によって、eコマース ベンダは共通の方法で製品および製品関連情報(価格、サイズ、色、機能など)にタグ付けできるようになり、ひいては、顧客がWeb内でショップを簡単に比較できるようになります。ただし、この場合にも、例えば、「華やかな(flowery)サマー ドレス」は「花柄プリント(floral print) のドレス」としても分類されるので、商品モデルを構成する品目の自動分類は失敗に終わります。つまり、人間が読むことのできるXMLタグではデータ フォーマットは簡潔ですが、XMLタグの価値はインテリジェントな定義ができるか、その使用方法を共通で守ることができるかどうかによって決まります。XMLを充分に活用するには、例外処理と概念間の距離づけに対応する必要があり、これはシステムが実際に機能するために不可です。

まとめ

オートノミーは、XMLタグを作成する際、手入力作業が多くあるために生じる非効率性に対処します。さらに、タグ自体もしくは関連情報、またはその両方について内容と目的を理解したうえで、XML管理のインテリジェンス レイヤーを追加します。

つまり、オートノミーは、XMLという車輪を実際に回転させるための潤滑油といえます。

オートノミー
テクノロジー
製品
サービス
業種
ユーザ
パートナーとOEM
ニュース & イベント
投資家の皆様へ