コンピュータのための知恵袋、農作物語彙体系を構築

スポンサーリンク
農作物が名前を変えても追跡できる環境構築

2019-04-16  国立情報学研究所

システム間の壁を越えたデータ連携を促進するため、コンピュータが参照できる農作物語彙体系(*1)を構築しました。この語彙体系に基づいて提供されるサービスは、食用農作物の農薬基準情報、外国語表記、遺伝情報の収集支援や政府が推奨する標準農作物名の使用促進に貢献します。

 農研機構(理事長:久間和生、茨城県つくば市、以下NARO)と国立情報学研究所(所長:喜連川優、東京都千代田区、以下NII)が参加するコンソーシアム内の研究チームは、システム間の横断的なデータ連携を促進するため、コンピュータが参照できる農作物語彙体系を構築しました。
 農業におけるSociety5.0の実現に向け、生産から消費に至るデータを横断利用した、スマート・フードチェーンシステム(*2)の構築が求められています。しかし、現状ではデータはシステム毎に個別に管理されるために、同じデータも名称が違うなど不整合があり、データの共用が進まず、貴重なビッグデータである営農情報が有効活用できていません。
 今回、農作物語彙体系に基づき開発したサービスは、食用農作物の農薬基準情報、外国語表記、遺伝情報の収集支援や、政府が優先的に使用すべきとした標準農作物名の普及に貢献します。今後は農作物語彙体系が農業データ連携基盤(WAGRI)(*3)上のデータ連携へ寄与することを目指します。

社会的背景

 農作物の安全性確保や高品質化のためには、農作物に関するデータが生産から消費に至るフードチェーン(*4)全体で共有されると同時に、そのデータを統合的に解析できる環境が求められています。農作物は、植物(例;”ダイズ”)、作物(例;”エダマメ”)、商品(例;”枝付きエダマメ”)のようにフードチェーンの段階によって、データを表す名称(以下、データ名)が異なることがあります。また、ひとつのフードチェーンの段階でも、農作物データを管理する組織によってデータの名称が異なることもあります(例;”エンドウ”、”エンドウマメ”)。さらに、グローバルな農作物流通の場合は、農作物データが日本語以外の言語で管理されます。このように、データが様々な農作物名で管理されていると、コンピュータが農作物の履歴をデータ名でたどることは容易ではありません。農作物データの連携には、情報の基準として農作物の名称を定義する語彙体系(例;”エンドウ”、”エンドウマメ”を同じ意味と定義)を構築して、それをコンピュータから利用できるようにする必要があります。

開発の経緯

 これまで、農作物名を整理した冊子体は発行されていたものの、複数のコンピュータから利用することは考慮されていませんでした。また、栽培時の「農薬使用基準(農薬登録における適用作物名、農林水産省が管轄)」と、人が摂取しても安全と評価された「残留農薬基準(食品残留農薬基準における食品名、厚生労働省が管轄)」は相互に関連しているにもかかわらず、データ名が統一されていないため、2種類の農薬基準データの連携は困難でした。そこで、NAROとNIIはコンピュータ処理が可能な「農作物語彙体系(Crop Vocabulary 、CVO)」を、2種類の農薬基準データの連携を主目的に、対象を生産者から卸売り業者までのフードチェーンの上流として共同で構築することとなりました。

農作物語彙体系の特徴

 農作物語彙体系は2種類の農薬基準データに含まれる1,249の農作物を、作物名(以下、CVO農作物名)、別名、英名、学名等で表したもので、コンピュータから扱うことが可能です。農作物語彙体系は、「ITシステムで用いる農作物の名称に関する個別ガイドライン(内閣官房)」で優先使用が推奨された農作物名(以下、ガイドライン農作物名)、2種類の農薬基準のデータ名、国際的農業標準語彙であるAGROVOC(国際連合食糧農業機関 http://aims.fao.org/vest-registry/vocabularies/agrovoc)、及び生物分類データベースNCBI Taxonomy(*5)等と連携しています。これらは、農作物語彙体系の公開ページで確認でき、データのダウンロードも可能です(http://www.cavoc.org/cvo/)。

農作物語彙体系に基づく開発サービスの特徴

【農作物名称サーチ】http://cavoc.org/cvo/application/CropNameSearch/

 開発した農作物名称サーチは、農作物語彙体系を農作物名(図1 “きゅうり”)とその同義語(”キュウリ”)で部分一致検索し、該当するCVO農作物名、「農薬使用基準」、「残留農薬基準」情報等を表示するものです。農作物名称サーチを利用することで、農作物によっては、①農薬基準のデータ名が収穫部位(図2 “キュウリ(葉)”)、生育ステージ(例”未成熟スイカ”)、用途(例”食用ギク”)で異なること、②「農薬使用基準」と「残留農薬基準」のデータ名が異なること(図1 “きゅうり(葉)”、”きゅうりの葉・花”)が確認でき、③連携するCVO農薬使用基準ページにより「農薬使用基準」データ名の意味を明確にできます(図3 「農薬使用基準」では”トマト”を3cmより大きいと定義)。収穫部位等で農薬基準が複数設定された農作物や2種類の農薬基準のデータ名が異なる農作物を簡単に確認できるため、農薬基準情報の正確かつ効率的収集の一助となります。

【農作物語彙体系にリンクする外部語彙ページの参照】

 農作物語彙体系にリンクする外部のAGROVOC学名ページから、生産物ページに移動することでCVO農作物の多言語表記が確認できるため(図4)、グローバルな農産物流通に活用できます。また、リンクするNCBI TaxonomyページからCVO農作物の遺伝的情報が確認できるため(図5)、例えば作物の収量や品質に及ぼす環境の影響を遺伝的要因から解析する際に活用できます。

【外部プログラムによる情報収集を支援】

 農作物名を①ガイドライン農作物名へ変換、②学名、英名へ変換するサービスを提供しています。このサービスを利用することで外部プログラムから農作物語彙体系の情報が簡単に収集できます(http://cavoc.org/cvo.php#api)。ガイドライン農作物名へ変換するサービスは、ガイドライン農作物名の使用を促進します。

今後の予定

 農作物語彙体系のデータは農業データ連携基盤(WAGRI)に実装されています。今後はWAGRI上のデータ連携に農作物語彙体系が寄与することを目指します。また、本成果は日本中央競馬会畜産振興事業で構築される「牛の飼養衛生オントロジー」の研究にも活用されます。

nii_newsrelease_20190403_image1.png

〈図1〉農作物名称サーチにおけるキーワード”きゅうり”の検索

nii_newsrelease_20190403_image2.png

〈図2〉農作物名称サーチによる”キュウリ”の農薬使用基準の設定確認
(”キュウリ”は収穫部位により農薬使用基準が複数設定。)

nii_newsrelease_20190403_image3.png

〈図3〉CVO農薬使用基準ページにおける”トマト”の定義の確認
(農作物名称サーチ検索結果にリンクするCVO農薬使用基準ページで定義確認。)

nii_newsrelease_20190403_image4.png

〈図4〉農作物語彙体系と連携するAGROVOCページ
(”キュウリ(総称)(http://www.cavoc.org/cvo/ns/1/%E3%82%AD%E3%83%A5%E3%82%A6%E3%83%AA)”の学名に対応するAGROVOC_ID”c_2004″(英語表記、Cucumis sativus)ページから、生産物属性”produces”の値AGROVOC_ID”c_10195″のページに移動することで”キュウリ”の25言語表記を確認できる。)

nii_newsrelease_20190403_image5.png

〈図5〉農作物語彙体系と連携するNCBI Taxonomyページ
(”キュウリ(総称)(http://www.cavoc.org/cvo/ns/1/%E3%82%AD%E3%83%A5%E3%82%A6%E3%83%AA)”の学名に対応するNCBI Taxonomyページ (ID”3659″)から “キュウリ” の遺伝的情報を確認できる。)

(*1) 語彙体系:用語を体系的に整理したもの。
(*2) スマート・フードチェーンシステム:ICTを活用し、国内外の多様化するニーズなどの情報を産業の枠を超えて伝達することで、それに即した生産体制を構築し、さらには商品開発や技術開発(育種、生産・栽培、加工技術、品質管理、鮮度保持等)にフィードバックし、農林水産業から食品産業の情報連携を実現するシステム(出典:内閣府農林水産戦略協議会(第4回;平成29年1月11日)配布資料-参考資料2)
(*3) 農業データ連携基盤(WAGRI):データの連携・共有・提供を可能にするため、今までバラバラだった農業に関わるデータを集約・蓄積し、農業関係者が必要なデータを相互運用できるようにするデータプラットフォーム(公開ページ https://wagri.net/ より)。 
(*4) フードチェーン:食品の一次生産から販売に至るまでの食品供給の行程のこと(出典:内閣府食品安全委員会ホームページ-用語集)。 
(*5) NCBI Taxonomy:NCBI(アメリカ国立生物工学情報センター)のEntrezデータベースに少なくとも1件以上登録されている全ての生物種と上位分類名を収集したデータベース。160,000以上の生物種が登録されています(出典:科学技術振興機構 Integbioデータベースカタログ)。 
※本発表は農研機構(国立研究開発法人 農業・食品産業技術総合研究機構)との共同発表です。

スポンサーリンク
スポンサーリンク