首页 / 专利库 / 电脑编程 / 标记语言 / Method and apparatus for mark-up language document conversion processing, program thereof, and recording medium for the program

Method and apparatus for mark-up language document conversion processing, program thereof, and recording medium for the program

阅读:594发布:2024-02-29

专利汇可以提供Method and apparatus for mark-up language document conversion processing, program thereof, and recording medium for the program专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To enable a user to grasp the outline of the whole contents in text type mark-up language form and a necessary part of the contents through voice. SOLUTION: A topic word list output part 10 divides specified contents in text type mark-up language form into blocks corresponding to topics, extracts topic words showing the topics for each block, and converts a list of the topic words corresponding to respective blocks to a voice-answerable mark-up language form and outputs it. A body output part 20 inputs a specified number of a topic word, converts the text body of the block corresponding to the specified topic word to the voice-answerable mark-up language format, and outputs it. COPYRIGHT: (C)2003,JPO,下面是Method and apparatus for mark-up language document conversion processing, program thereof, and recording medium for the program专利的具体信息内容。

  • 【特許請求の範囲】 【請求項1】 テキスト型のマークアップ言語形式のコンテンツを音声応答可能なマークアップ言語形式のコンテンツに変換するマークアップ言語文書変換処理方法であって,変換対象となるテキスト型マークアップ言語形式のコンテンツを取得する過程と,取得したコンテンツを複数のブロックに分割する過程と,分割した各ブロックごとの話題を示す話題語を各ブロックのコンテンツから抽出し,各ブロックに対応する話題語のリストを作成する過程と,前記話題語のリストを音声応答可能なマークアップ言語形式のコンテンツに変換して出力する過程とを有することを特徴とするマークアップ言語文書変換処理方法。 【請求項2】 請求項1記載のマークアップ言語文書変換処理方法において,前記出力した話題語のリストから一つの話題語を選択する情報を入力する過程と,選択された話題語に対応するブロックのコンテンツを音声応答可能なマークアップ言語形式のコンテンツに変換して出力する過程とを有することを特徴とするマークアップ言語文書変換処理方法。 【請求項3】 テキスト型のマークアップ言語形式のコンテンツを音声応答可能なマークアップ言語形式のコンテンツに変換するマークアップ言語文書変換装置であって,変換対象となるテキスト型マークアップ言語形式のコンテンツを取得する手段と,取得したコンテンツを複数のブロックに分割する手段と,分割した各ブロックごとの話題を示す話題語を各ブロックのコンテンツから抽出し,各ブロックに対応する話題語のリストを作成する手段と,前記話題語のリストを音声応答可能なマークアップ言語形式のコンテンツに変換して出力する手段とを備えることを特徴とするマークアップ言語文書変換装置。 【請求項4】 請求項3記載のマークアップ言語文書変換装置において,前記出力した話題語のリストから一つの話題語を選択する情報を入力する手段と,選択された話題語に対応するブロックのコンテンツを音声応答可能なマークアップ言語形式のコンテンツに変換して出力する手段とを備えることを特徴とするマークアップ言語文書変換装置。 【請求項5】 請求項1または請求項2記載のマークアップ言語文書変換処理方法をコンピュータに実行させるためのマークアップ言語文書変換処理プログラム。 【請求項6】 請求項1または請求項2記載のマークアップ言語文書変換処理方法をコンピュータに実行させるためのプログラムを記録したことを特徴とするマークアップ言語文書変換処理プログラムの記録媒体。
  • 说明书全文

    【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は,テキスト型のマークアップ言語形式のコンテンツを音声応答可能なマークアップ言語形式のコンテンツに変換するマークアップ言語文書変換処理方法に関し,特にHTML(Hypertext M
    arkup Language) 等のテキスト型のマークアップ言語形式のコンテンツを音声端末に音声によって出するため,テキスト型のマークアップ言語形式のコンテンツを音声出力に適した長さに部分的に簡略化することで,テキスト型のマークアップ言語形式のコンテンツを音声に変換して出力することを可能とした技術に関するものである。 【0002】 【従来の技術】携帯電話からインターネットのホームページにアクセスするような場合,一般にコンテンツを受信し,画面に表示できるデータ量は限られている。 そのため,ホームページのコンテンツを音声で読み上げることが考えられている。 【0003】従来は,インターネットのテキスト型のマークアップ言語形式のコンテンツを音声で出力する場合には,あらかじめ指定されたテキスト型のマークアップ言語形式の一部分のみを音声データに変換したものを用意し出力していた。 これに対し,コンテンツ全体を音声で読み上げるという処理を行う場合には,コンテンツの長さに応じて音声の読み上げが終了するまで長い時間がかかるため,ユーザにとって短時間で全体の内容または必要な部分の内容を把握するのが困難であった。 【0004】ここで,テキスト型のマークアップ言語形式としては,例えば,インターネットの世界ではHTM
    Lがあり,音声応答可能なマークアップ言語形式としてはVXML(Voice Extensible Markup Language)がある。 VXMLは,XMLをベースとする音声情報のマークアップ言語で,音声認識合成を利用した自動電話応答システム用アプリケーションの開発に最適な言語である。 【0005】 【発明が解決しようとする課題】上述のように,従来,
    インターネットにおけるホームページを記述するようなテキスト型のマークアップ言語形式のコンテンツを音声で出力する場合,あらかじめ指定されたテキスト型のマークアップ言語形式の一部分のみを出力する方法やコンテンツ全体を読み上げる方法が用いられていた。 【0006】しかし,あらかじめ指定された一部分のみを出力する方法では,テキスト型のマークアップ言語形式のコンテンツの全体を音声で把握することができないという問題があり,また,コンテンツ全体を音声で読み上げるという方法では,全体の内容を把握するのにコンテンツの長さに応じて長い時間がかかるという問題があった。 【0007】本発明は,上記問題点の解決を図り,テキスト型のマークアップ言語形式の一部をあらかじめ指定せずに,また,コンテンツ全体を音声で読み上げることをしないで,テキスト型のマークアップ言語形式のコンテンツの必要な部分だけをユーザが短時間で把握できるようにすることを目的とする。 【0008】 【課題を解決するための手段】本発明は,上記課題を解決するため,テキスト型のマークアップ言語形式のコンテンツを話題に応じたブロックに分割し,各ブロック毎の話題を示す話題語を抽出し,話題語を音声によって読み上げることで,テキスト型のマークアップ言語形式のコンテンツを読むことなく音声によってテキスト型のマークアップ言語形式の全体を把握することが可能となるようにする。 ここで,各ブロックに分割された本文は,
    音声によって読み上げるのに適切な長さに分割されるため,指定したブロックの本文を音声によって読み上げることが可能である。 【0009】以上の処理は,マークアップ言語文書変換を行うためのコンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムは,コンピュータが読み取り可能な可搬媒体メモリ,半導体メモリ,ハードディスク等の適当な記録媒体に格納することができる。 【0010】 【発明の実施の形態】本発明の実施の形態について,図面を参照して説明する。 図1は,本発明を実施するためのシステムの構成例を示す図である。 本実施の形態におけるシステムは,HTMLテキストコンテンツを出力するインターネット上のWWWサーバ装置2と,WWWサーバ装置2の出力するHTMLテキストコンテンツの一部または全部をVXMLテキストに変換するマークアップ言語文書変換装置1と,このマークアップ言語文書変換装置1の出力したVXMLテキストを解釈し記述された音声認識および音声合成の動作をするVXMLサーバ装置3と,このVXMLサーバ装置3に公衆回線により接続され音声やボタン操作で入出力を行うユーザ端末4
    と,マークアップ言語文書変換装置1とWWWサーバ装置2とVXMLサーバ装置3とを接続するネットワーク5から構成される。 【0011】マークアップ言語文書変換装置1は,WW
    Wサーバ装置2が出力したHTMLテキストコンテンツを入力とし,それを話題に応じたブロックに分割し,各ブロックの話題語を出力する話題語リスト出力部10
    と,話題語リスト出力部10の出力結果を参照し,ユーザの選択したブロックの部分の本文をVXMLテキストに変換して出力する本文出力部20とから構成される。 【0012】ユーザは,話題語リスト出力部10の出力結果である話題語を聞くことで,コンテンツの概要を把握することができ,さらに詳細に本文を聞きたい場合には,聞きたいブロックの番号(話題語指定番号)を選択すればよい。 【0013】図1に示すシステムの動作概要は,以下のとおりである。 ユーザが携帯電話等のユーザ端末4からWWWサーバ装置2のWebページにアクセスすると,
    マークアップ言語文書変換装置1は,アクセスされたW
    ebページを記述するHTMLテキストコンテンツをW
    WWサーバ装置2から取得する。 マークアップ言語文書変換装置1は,話題語リスト出力部10によって,HT
    MLテキストコンテンツを話題に応じたブロックに分割し,各ブロックごとの話題の中心となる話題語を抽出して,それらを音声応答可能なマークアップ言語形式であるVXMLテキストに変換する。 マークアップ言語文書変換装置1は,そのVXMLテキストをVXMLサーバ装置3に送ることにより,VXMLサーバ装置3は,ユーザ端末4に対して各ブロックごとの話題語を読み上げる。 【0014】ユーザが,ユーザ端末4に音声出力された各ブロックごとの話題語を聞き,読み上げを希望するブロックがあれば,そのブロックの話題語を指定する番号を音声またはプッシュボタン操作などによりVXMLサーバ装置3に送信する。 VXMLサーバ装置3は,ユーザ端末4から送信されたブロックの番号をマークアップ言語文書変換装置1に通知する。 【0015】マークアップ言語文書変換装置1では,ブロックの番号をVXMLサーバ装置3から受信すると,
    本文出力部20によって,ユーザが選択した番号のブロックの本文を元のHTMLテキストコンテンツから抽出し,その部分をVXMLテキストに変換し,VXMLサーバ装置3に出力する。 VXMLサーバ装置3は,マークアップ言語文書変換装置1が出力したVXMLテキストを解釈し,音声合成によってそのブロックのコンテンツの内容を読み上げ,ユーザ端末4に音声で出力する。 【0016】図1に示すシステム構成は一例であり,例えばWWWサーバ装置2の中にマークアップ言語文書変換装置1を組み込んで本発明を実施することもでき,また,マークアップ言語文書変換装置1の中にVXMLサーバ装置3の機能を組み込むような実施も可能である。 【0017】図2に,本実施の形態におけるマークアップ言語文書変換装置1の詳細な構成例を示す。 【0018】マークアップ言語文書変換装置1は,話題語リスト出力部10と本文出力部20を備え,話題語リスト出力部10は,ファイル取得部11,コンテンツブロック化部12,話題語抽出部13,話題語リスト作成部14,音声出力用文字列変換部15,変換結果出力部16からなる。 また,本文出力部20は,話題語指定番号入力部21,本文抽出部22,音声出力用文字列変換部23,変換結果出力部24からなる。 【0019】図3は,話題語リスト出力部10の処理フローチャートである。 話題語リスト出力部10のファイル取得部11は,まず入力パラメータの解析を行い,ユーザの指定したコンテンツのURL(Uniform Resource
    Locator)を取得する(ステップS1)。 次に,そのU
    RLで指定されたHTMLファイルをWWWサーバ装置2から取得する(ステップS2)。 図4に,話題語リスト出力部10がファイル取得部11によって取得したH
    TMLファイルのテキストコンテンツの例を示す。 以下,このHTMLテキストコンテンツについての処理の例について説明する。 【0020】コンテンツブロック化部12は,取得したHTMLファイルのテキストコンテンツを,音声による読み上げに適した適当な長さのブロックに分割する(ステップS3)。 HTMLは,よく知られているように,
    SGML(Standard Generalized Markup Language)の流れをくむ構造化言語であり,テキストコンテンツを構造化するのに役立っている。 構造化により,テキストコンテンツを部分部分にブロック化することは比較的容易である。 テキストコンテンツをブロック化する場合の最大ブロック長はあらかじめ決めておく。 【0021】まず,ブロック構造を認識するためのタグを検索する。 このブロック構造を認識するためのタグは,例えばFRAME,H1,H2,…,TABLEなど,本文の何らかの区切りになるものである。 これらのブロック構造を認識するためのタグの種類を,あらかじめテーブル化して記憶しておき,そのテーブルを用いてタグを検索し,該当するタグがあれば,さらに終了タグを検索してタグ範囲を決める。 そのタグ範囲について,
    コメント文などの音声出力に不要な部分を削除し,本文の有無を確認するとともに,ブロックに含まれる本文部分のブロックサイズまたはテキストサイズを計算する。
    サイズが最大ブロック長より大きい場合には,適当な長さになるように,必要に応じて一つのタグ範囲を強制的に細分化する処理を行う。 【0022】図5に,図4に示すHTMLテキストをブロックに分割した例を示す。 この例では,図5のように,HTMLテキストが第1ブロックB1から第4ブロックB4まで4個のブロックに分割されている。 分割結果は,例えば各ブロックの開始ポジションと終了ポジションまたはサイズの情報として記憶しておく。 ポジションは,HTMLファイルの先頭からの位置をバイト単位で示す。 【0023】次に,話題語抽出部13は,分割された各ブロックから,ブロックの内容をもっともよく表していると考えられる話題語を抽出する(ステップS4)。 話題語を抽出する方法として,どのような方法を用いてもよいが,例えばテキストコンテンツの構造に基づいて話題語を抽出する方法,テキストコンテンツの意味解析を行って話題語を抽出する方法,その他,適切な話題語を抽出する方法を用いることができる。 具体的には,例えば該当ブロックから先頭を自立語とする所定の適切話題語長で示される長さの文字列を切り出すといったことが考えられる。 本実施の形態では,抽出した話題語を音声で出力するので,各話題語を1〜2秒で聞き取ることができるように,適切話題語長を10文字程度にするのが適切である。 【0024】話題語リスト作成部14は,話題語抽出部13が各ブロックから抽出した話題語に,ブロック番号(1〜4)を付けて,話題語リストを作成する(ステップS5)。 【0025】図6に,図5に示す各ブロックB1〜B4
    から抽出した話題語をもとに作成した話題語リストの例を示す。 第1ブロックB1から抽出した話題語は「ラーメンに関する評価」であり,その先頭にブロックの番号=1が付与される。 第2ブロックB2から抽出した話題語は「[第一部]ラーメン店の評価」,第3ブロックB
    3から抽出した話題語は「ラーメン店」,第4ブロックB4から抽出した話題語は「ラーメン店評価テーブル」
    である。 【0026】次に,音声出力用文字列変換部15は,話題語リスト作成部14が作成した話題語リストを音声出力用文字列,すなわちVXML形式に変換する(ステップS6)。 このとき,文字列変換用テーブルを用いて,
    文字列を変換する。 【0027】図7に,文字列変換用テーブルの例を示す。 このテーブルを用いて,例えば括弧や空白などの音声による読み上げに適さない文字が含まれる文字列について,それらを読み上げに適した文字列に変換する。 文字列変換用テーブルには,例えば図7に示すように,各置き換え対象文字列ごとに,置き換え文字列,半文字の大/小の区別,実際の置き換え対象文字列の文字間の空白の扱いなどの情報が記載されている。 このテーブルによって,置き換え対象文字列は,置き換え文字列に変換される。 半角文字の大/小の区別は,1のときは大文字/小文字を区別し,0のときは大文字/小文字の区別をしないことを示し,実際の置き換え対象文字列の文字間の空白の扱いは,1のときは空白を無視し,0のときは空白を無視しないことを示している。 【0028】音声出力用文字列変換部15は,図7に示す文字列変換用テーブルを用いて音声による読み上げに適さない文字列を,音声出力に適した文字列に変換した後,VXMLに必要なタグや付随情報を付加して,音声出力のためのVXML形式のテキストを作成する。 【0029】図8は,話題語リストをVXML形式に変換した例を示す。 ここでは,話題語リストを携帯電話に音声で出力するのに適したVXML形式のテキストの例を示しており,図8に示すように,携帯電話のユーザに1から4までの話題語のどれかを選択することを促す文字列が付け加えられている。 【0030】変換結果出力部16は,音声出力用文字列変換部15が作成したVXML形式のテキストに,さらに図9に示すようなVXMLの定型的なテキストを付加して,図1に示すVXMLサーバ装置3に出力する(ステップS7)。 【0031】これによりVXMLサーバ装置3では,図9に示すVXMLテキストのうち<prompt>のタグから</
    prompt> のタグまでの文字列を,合成音声で読み上げ,
    ユーザ端末4に出力することになる。 【0032】次に,マークアップ言語文書変換装置1における本文出力部20の処理について説明する。 図10
    は,本文出力部20の処理フローチャートである。 【0033】本部出力部20の話題語指定番号入力部2
    1は,VXMLサーバ装置3から話題語指定番号を入力する(ステップS10)。 この話題語指定番号は,図8
    に示すVXMLテキストをユーザ端末4に出力したときに,ユーザ端末4から音声またはプッシュボタン(数字キー)の操作によって入力された番号である。 【0034】本文抽出部21は,図6に示す話題語リストを参照し,入力した話題語指定番号から指定された話題語に該当するブロックを特定する(ステップS1
    1)。 例えば話題語指定番号が「3」の場合,図5に示すブロックのうち第3ブロックB3が指定されたものと解釈する。 本文抽出部22は,ブロックを特定した後,
    図4に示すようなHTMLファイルのテキストから該当するブロックの本文,すなわち図5に示す第3ブロックB3の本文テキスト部分を抽出する(ステップS1
    2)。 【0035】音声出力用文字列変換部23は,本文抽出部22が抽出した本文テキストの部分を,話題語リスト出力部10における音声出力用文字列変換部15と同様に,図7に示す文字変換用テーブルを用いて,音声による読み上げに適した文字列に変換する。 すなわち,抽出したテキスト中に音声による読み上げに適さない文字,
    文字列が含まれる場合に,それらを読み上げに適した文字列に変換する。 その後,VXMLに必要なタグや付随情報を付加して,音声出力のためのVXML形式のテキストにする(ステップS13)。 【0036】変換結果出力部24は,音声出力用文字列変換部23が作成したVXML形式のテキストに,さらに図1に示すVXMLサーバ装置3が音声出力するためのVXMLの定型的なテキストを付加して,その結果をVXMLサーバ装置3に出力する(ステップS14)。 【0037】図11は,音声でユーザ端末4に出力されるブロック本文の例を示している。 上記の例において話題語として「ラーメン店」を指定する「3」の話題語指定番号が入力されると,図11に示すような第3ブロックB3の本文が抽出され,VXMLテキストに変換されて出力され,これによって,ユーザ端末4にその内容が音声で出力される。 【0038】さらに,ユーザ端末4からVXMLサーバ装置3を介して話題語指定番号が入力されると,本文出力部20は,入力された話題語指定番号に対応するブロックに対して,同様に以上の処理を繰り返す。 【0039】以上説明した例では,本文出力部20は,
    話題語リストの出力と同様に指定されたブロック部分の本文を音声で出力するものとしたが,該当ブロックを特定した後,音声出力用文字列に変換しないで,HTML
    テキストの形式でユーザ端末4に出力してもよい。 この場合,ユーザ端末4には抽出された本文の部分が画面表示されることになる。 ユーザ端末4の受信データ量に制限があるような場合でも,短いブロックに分割されているため,ユーザ端末4は受信可能であり,画面に表示することが可能である。 【0040】以上の実施の形態において,もし,指定されたHTMLファイルが以前にすでに音声出力の対象となったものであり,そのテキストコンテンツをブロック分割した結果および各ブロックから話題語を抽出した結果(話題語リスト等)を保存している場合には,あらためて同じ処理を繰り返すことなく,保存してあるブロック分割結果および話題語リストを利用して,処理を進めることができる。 この場合,もちろんWWWサーバ装置2のHTMLコンテンツが更新されていないことが条件である。 もし更新されている場合には,HTMLファイルの取得およびブロック分割処理が必要になる。 【0041】 【発明の効果】以上説明したように,本発明では,HT
    MLコンテンツを話題に応じたブロックに分割し,各ブロック毎の話題を示す話題語を抽出し,話題語を音声によって読み上げることで,HTMLコンテンツの全部を読むことなく音声によってHTMLの全体の概要を把握することが可能となる。 また,各ブロックに分割された本文は,音声によって読み上げるのに適切な長さに分割されるため,指定された話題語に関するブロックの本文を音声によって読み上げることができ,ユーザにその部分の本文を聞かせることができるようになる。

    【図面の簡単な説明】 【図1】本発明を実施するためのシステムの構成例を示す図である。 【図2】本実施の形態におけるマークアップ言語文書変換装置の詳細な構成例を示す図である。 【図3】話題語リスト出力部の処理フローチャートである。 【図4】HTMLファイルのテキストコンテンツの例を示す図である。 【図5】HTMLテキストをブロックに分割した例を示す図である。 【図6】話題語リストの例を示す図である。 【図7】文字列変換用テーブルの例を示す図である。 【図8】話題語リストをVXML形式に変換した例を示す図である。 【図9】VXMLサーバ装置に出力するVXMLテキストの例を示す図である。 【図10】本文出力部の処理フローチャートである。 【図11】音声でユーザ端末に出力されるブロック本文の例を示す図である。 【符号の説明】 1 マークアップ言語文書変換装置2 WWWサーバ装置3 VXMLサーバ装置4 ユーザ端末5 ネットワーク10 話題語リスト出力部11 ファイル取得部12 コンテンツブロック化部13 話題語抽出部14 話題語リスト作成部15 音声出力用文字列変換部16 変換結果出力部20 本文出力部21 話題語指定番号入力部22 本文抽出部23 音声出力用文字列変換部24 変換結果出力部

    ───────────────────────────────────────────────────── フロントページの続き (72)発明者 宮本 勝 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内(72)発明者 稲垣 博人 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内Fターム(参考) 5B075 KK07 ND03 NK02 NK06 NK39 NR05 NS10 PP25 PQ46 QS01 5D045 AB01

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈