データセットの統計情報

カテゴリ 属性
1.1 人名
異表記, 本名, 別名・旧称, 国籍, 地位職業, 生年月日, 没年月日, 時代, 所属組織, 学歴, 誕生地, 居住地, 没地, 死因, 作品, 受賞歴, 参加イベント, 師匠, 父母, 家族, 読み
1.2 神名
読み, 正式名称, 別名, 旧称, 信仰大陸地域, 信仰国・GPE, 信仰地域, 宗教・信仰, 性別, 住処, 姿, 位, 性質(神), 同一神, 配偶者, 父母, 子, 兄弟姉妹, 眷属, 祭祀施設, 祭礼, 武器(神), シンボル, 聖獣, 乗り物(神), 登場作品1, 登場作品2, 構成する神, 名前の謂れ
...
...

分類タスクのデータセット

データ名 Wikipediaバージョン 拡張固有表現定義バージョン ページ数
2018 分類
20190124
8.0
920,444
2020 分類
20190124
8.1
920,444
2022 分類
20190124
9.0
920,444

属性値抽出タスクのデータセット

ページ数 属性種類数 属性値延べ数 1属性当たりのインスタンス数 Wikipediaバージョン
19,711
1,671
910,567
544.92
Wikipedia2017 (2018, 2019, 2020-JP対象の78カテゴリー)、Wikipedia2019 (2022に追加された100カテゴリー)

リンキングタスクのデータセット

データ名 カテゴリー数 ページ数 属性種類数 リンク元数 リンク先数
2021 リンク教師データ
7
350
83
7,284
7,366
2021 リンク開発データ
7
706
85
13,887
13,997
2022 リンク教師データ
178
1,397
958
59,429
59,715

結果の提出方法は森羅コミュニティ (Slack) で案内しますので
ご登録お願いします!

※登録しても結果の提出義務は生じません