人文科学とコンピュータシンポジウム(じんもんこん2023)「人文学のためのデータインフラストラクチャー構築に向けて」(2023/12/9)

 オープンサイエンスの進展とともに、その基盤となる研究データのインフラストラクチャー(インフラ)構築が着々と進められている。研究データインフラに求められるのは、研究成果の検証可能性を担保する機能だけでなく、そのデータを元にしたさらなる発展的な研究の展開や社会へのアウトリーチなど、様々なものが考えられる。それを実現していくためには、構築・運用のしやすい簡潔なメタデータ構造とともに、必要に応じて専門知につながる深い情報という、相反する要素が求められることになる。デジタル時代の研究資料たるデータに様々な文脈から多様な専門知が埋め込まれる人文学においては、この課題はより切実なものとして現前しつつある。すでに海外では、欧州におけるDARIAH(Digital Research Infrastructure for the Arts and Humanities)やCLARIN(Common Language Resources and Technology Infrastructure)等の人文学向けデジタルインフラや、さらにそれを社会科学と統合したSSHOC(Social Sciences and Humanities for the European Open Science Cloud)に見られるように、着々と整備が進められ、大きな広がりを見せている。そして、それを支える枠組みとして、TEI(Text Encoding Initiative)ガイドラインに準拠したテキストデータの構造化やIIIF (International Image Interoperability Framework)によるアノテーションなどの国際標準的なルールが整備され、一方で、TaDIRAH(The Taxonomy of Digital Research Activities in the Humanities)による研究活動の語彙設計など、草の根的な活動も貢献する形となっている。

 日本でも、日本学術振興会においては人文学・社会科学データインフラストラクチャー強化事業が推進され、人間文化研究機構からはnihuBridgeが公開されるなど、人文学におけるデータインフラは徐々に基礎が固められつつある。こうした動向はどちらかと言えば横断性を重視したものとして広く様々な関心から人文学の研究データに関心を持ってもらい、それを通じて社会に貢献していくことが期待される。一方で、個々のデータを適切に活用するためには、データが作成されたコンテクストやそこに含まれる意味のある情報を適切かつ簡潔に利用者に伝えることが課題となる。技術的には、上述のIIIFやTEI等、国際的な枠組みに基づく取組みが国内でも広がりつつあり、TaDIRAHの日本語版も公開されている。しかしながら、こうした動向は、人文学の様々な分野における方法論の多様さを踏まえるなら、まだ端緒についたばかりである。今後、より多くの分野・方法論に対応できるようなデータの構築方法や、一方で、より効果的な横断的データ探索の手法、そして、そこに対応可能な成果の提示の仕方など、課題は山積している。すなわち、デジタル時代を踏まえた人文学の成果を共有するための適切な枠組みの構築とその普及は喫緊のテーマとなっている。この状況を踏まえ、本シンポジウムでは、「人文学のためのデータインフラストラクチャー構築に向けて」というテーマを設定したい。国内外の様々な研究活動を広く横断しつつ深く提示する研究を踏まえ、国際的にも広く展開できる基礎の構築につなげ、これをもって国内でのプレゼンス向上にも寄与できる大会としたい。

日程:2023年12月9日(土)~12月10日(日)
会場:オンライン開催(拠点) 一般財団法人人文情報学研究所
主催:情報処理学会人文科学とコンピュータ研究会(IPSJ SIG-CH)
口頭発表、インタラクティブセッション、招待講演、企画セッション(予定)
参考:研究会ホームページ: http://www.jinmoncom.jp/
   シンポジウムホームページ: http://jinmoncom.jp/sympo2023/