かたくりかたこりかたつむり

やっぱり誤字脱字は氷山の一角

立命館pixiv論文問題についての雑感まとめ

1 はじめに

 

すでに界隈では過去のことになりつつありますが、2017年5月下旬に、立命館大学の院生によるpixiv小説を使用した論文事件というものがありました。その騒動から1ヶ月以上経ちますが、学会、大学、pixivからの音沙汰はありません。

 

その間、個人的に色々考えてはみたものの、要約のみで論文の本文を読んでいませんでした。しかし、今回本文を読んでみたところ色々と印象が変わったので、自分なりの考えをここにまとめておこうと思いました。ですので、新事実が明らかになったりすることはありません。あくまで私の考えを整理するためのものです。

なお、私の自己紹介としては、学部で卒論を書いたオタクです。今回の件は、私の興味のある複数の分野にまたがる話題ということです。

 

 

2 そもそも何があったのか?

 

2.1 発端と反応について

 

2017年5月24日の「2017年度 人工知能学会全国大会(第31回)」にて、立命館大学の学生(修士1年)が『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』を発表しました。その中で、pixivに投稿されたR18小説(10作品中8本がBL)が分析対象として使用・引用されました。作品名は伏せられていたものの、作品URLと作者名が記載されており、そのPDFが学会ウェブサイトで閲覧可能な状態になっていました。

このことがTwitterで炎上し、作品を論文に使用された作者が作品を非公開またはマイピク限定公開・削除とする騒ぎとなりました。まとめが作成された時点では10作品中7本、これを書いている時点では4作品が該当しています。

これを受けて、学会ウェブサイトにて論文のPDFが非公開になり、pixivがTwitterにて声明を発表しました。しかし、1ヶ月以上経ってもその後どうなったのかは分からないままです。

 

 

3 何が問題なのか

 

3.1 論文の概要

 

アーカイブで読むことは可能ですが、ここに該当論文の概要をまとめます。

 

タイトル:ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング

 

インターネット上にある、未成年に対して有害となる情報、特に性的な表現に関して、種類と特徴の分析を行っている。分析対象はpixivに投稿されたR18小説のうち2016年10月のウィークリーランキング10位の10個。小説から切り出した文の性表現を4つのクラスに分類。クラスは以下の通り。

 

クラス1: 猥褻な文脈に含まれ,直接的な性表現を含む文

クラス2: 猥褻な文脈に含まれ,間接的な性表現を含む文

クラス3: 猥褻な文脈に含まれないが,直接的な性表現を含む文

クラス4: 猥褻な文脈に含まれるが,いずれの性表現も含まない文

 

なおクラスの説明中に実際の小説の文章が引用されている(引用に関しては後述)。クラスの分類は第一著者が人手で行っている。

文中に含まれるクラス分類の割合を呈示。クラス4が最も割合が多く、クラス3が最も割合が少なかった。クラス別のフィルタリング方法について考察し、クラス2からクラス4の表現をフィルタリングするためには、文が含まれるドメイン・文脈を判定する必要があり、その上でフィルタリングに使用できる特徴を調査する必要があるとしている。

 

 

3.2 法的な問題について

 

著作権法上は、ウェブ上の個人の投稿であっても引用・情報解析することに問題はありません。本文との主従の関係がある、出典の明示をするなどの条件を満たしていれば、引用というのは特に断りなく行っていいものです。そして、引用のない論文というのは信頼度ゼロです。

ただし、個人を特定できるような書き方が名誉毀損やプライバシーの侵害になる可能性はあるようです。門外漢なので深くは追究しません。ひとまず今回の場合、ただちに問題にはならないのではと思います。

 

 

3.3 研究倫理的な問題

 

著作権法とは別になりますが、研究倫理というものがあって、今回はここに引っかかる部分があるのではないかと思います。研究倫理とは研究に必要とされる規範のことで、不正の防止や協力者のプライバシーの保護などが含まれています。研究者による論文や、出版社を通して世に出した書籍とは違い、インターネット上の個人の投稿を扱う際には少々配慮が必要だったのでは、というものです。

研究者の論文などと違って、個人によるインターネット上の投稿は、あまりにも作者とデータの距離が近い。一言で言うと生々しい。そんな生々しいものの取り扱いを誤れば、今回のようなことが起こっても不思議ではありません。仮に、論文の著者が自分の論文を他の論文に引用されたことで激怒しても一笑に付されるでしょうが、個人がそんなことを想定しているとは言い難いのです。

 

おまけに、個人の投稿を仮に「単なるデータ」として扱う場合、匿名化して個人を特定できないようにするのが普通ではないでしょうか。以下はpixivのプログラマーがpixiv小説で機械学習を行った記事ですが、手法的に問題はなさそうです。加えて、「女性向け作品には棲み分けという文化が存在し」ていることを把握しているなど、分析対象についてある程度の知識を有しており、今回の件とは似て非なるものです。

 

pixiv小説で機械学習したらどうなるのっと【学習済みモデルデータ配布あり】

 

※2020/09/09追記

上記のように書きましたが、例えば今回該当する分野の研究倫理に、一般人がウェブ上に投稿した内容を扱う際の注意事項がない場合、研究倫理的には問題ありません。ただし、その注意事項がないこと自体はかなり問題となるでしょう。 

 

3.4 研究としての問題

 

これまで「論文」と書いてきましたが、当該の文章は正確には「予稿」ということです。予稿とは、学会で発表する際にその概要を記述したもので、正式な論文とは違って事前審査がないとのこと(以下、『論文』ではなく『予稿』と表記)。私は学部卒なので予稿については知りませんでしたが、要するにガチガチに固めた論文とは分量的にもクオリティ的にも同等ではないということです。

 

「学会の全国大会」って、なんだ? - BL作品を題材とした人工知能研究が炎上した件から(みわよしこ) - 個人 - Yahoo!ニュース

※該当ページがなくなっていたためウェブアーカイブに飛びます

 

以上を踏まえた上で、この予稿の問題と思われる箇所を挙げていきます。

 

 

  • 文中に「有害」「猥褻」の定義がないまま進めている。正確にはそうではないと取れるが、小説の作者が「自分のR18小説が『有害だ』と公に晒し上げられた」と感じるのも無理はないかもしれない。

 

 

  • pixivに投稿された二次創作小説(主にBL)を分析する必然性が示されていない。また、研究目的が「二次創作におけるR18表現のフィルタリング」だったら分かるものの、今回の研究目的に合致しているとは言い難い。単に無料で手に入るから分析対象にしたのでは? と思えるくらい、目的から分析対象へのつなぎが荒い。

 

 

  • サンプル数が小説10本は少なすぎるのでは? と思うが、これに関してはとりあえず問題はないという意見もあり、また専門外のため判断は保留。

 

 

  • 本文中に作品内の一文の引用があるが、引用の条件を満たしていない(出所の明示がされていない)。また、文章の句読点等を断りなく改変しているらしい。

 

yasuokaの日記: 著作権法における「引用」と「技術の開発又は実用化のための試験の用に供するための利用」と「情報解析のための複製等」

 

  • 例に挙げられた文では、キャラクター名は伏せずに男性器を示す単語は伏せるという、よく分からないバランス感覚を発揮している。つまり、著者は分析対象の作品の作者の気持ちを全く分かっていないと推測できる。このあたりも怒りを買うに十分だと思う。

 

 

  • 分析対象のURLや作者名は記載せず、「○○年○月○日から××年×月×日までの期間、pixivウィークリーランキング1位から○位にランクインしたR18小説○○個を対象にした」とか書くのが普通では? そして小カテゴリとして「BL」「NL」の記載があるが、それを載せる必然性や、そもそも「BL」「NL」とは何かという説明もない。だいたいBLとNLのR18表現を混ぜて分析していいのだろうか?

 

 

  • タイトル詐欺。文中にもあるが実際には予備研究レベル。

 

 

結論:全体的に出来が悪い。

 

 

3.5 二次創作側の問題・事情

 

この件に関して言及している二次創作者側のツイートに散見されましたが、「無断引用」なんてものはそもそもありません。引用というのは、条件さえ満たせば無許可で行っていいことになっています。また、今回の件は無断転載(著作権法の条件を満たさず、他人の著作物を複製すること)にも当たらないと思われます。

何が言いたいのかと言うと、「著作権法も知らない、話の通じない奴らが勝手に怒ってる」と思われるのが一番都合が悪いということです。怒るのは分かりますが、法律的にとんちんかんなことを言っている人達の主張が聞き入れられるのは難しいと思います。

 

 

3.5.1 二次創作BL界隈の背景について

 

とは言え、二次創作BL界隈というのは極めて特殊な世界で、それが今回炎上した大きな理由でもあります。

そもそも、男性とは違って女性がR18作品を書くことはしばしば好奇の目で見られ、嫌がらせを受けたり排除されてきた経緯があるため(実際に被害を受けた人もいます)女性向け二次創作BL界というのは、「外の目から隠れる」「晒し上げに敏感」という傾向のある界隈と言えるのです。

今回の件で分析対象になったR18タグの付けられた作品も、界隈内での「棲み分け」というやつで、「見せたくない・見たくない人には見せず、見たい人にだけ見せる」という文化によって付けられているという側面が大きいです。

ただし、部外者にとってR18タグは「恥ずかしいので内輪だけで楽しみ、公には見せたくない」という意思表示にはならないのもまた事実です。むしろ今回の場合、R18タグを付けていたからこそ分析対象になってしまったと言えます。

 

 

3.5.2 二次創作と著作権について

 

二次創作フリーのものを除き、二次創作は基本的に著作権的にグレー~黒ですが、だからといって二次創作者が泣き寝入りをするべき理由にはなりません。というのも、二次創作にも著作権は発生するからです。

ただし、今回の件で著作権的にアウトであるのは部分的であってメインの問題ではないため、著作権の話を持ち出すのは分が悪い。少なくとも今回に限っては、著作権を持ち出すのは適当ではないと言えます。

なお、今回の件でpixivがTwitterにて声明を発表しましたが、どうも転載と引用の区別がついていないようです。不安です。

 

4 まとめ

 

4.1 一体何だったのか?

 

「明確なルールが未整備のグレーな分野で、未熟な研究者(当時は学部生)が過敏な界隈に土足で上がり込んだ結果、炎上した事件」と言えるのではないでしょうか。

とにかく、何を置いても予稿の出来が悪すぎます。学部卒でもツッコミ入れられるレベル。本来、論文の出来と研究倫理は切り離して考えるべきことなのですが(出来が良くても二次創作者の気分を害する論文はあり得ます)、今回については確実に未熟ゆえの配慮の無さに起因していると言っていいと思います。指導教員も何をしているのか疑問です。正直、他の研究者も迷惑しているのでは?

 

ただし、BL作品に対して悪意があったと仮定するのは待ったほうがいいのではないでしょうか。

「ハンロンの剃刀」は、「愚かさゆえに起こったと説明できる過失を、悪意のせいだと考えるな」という内容の、経験則の一種。

レファレンス協同データベース

今回の件については、私はただ著者が無能だったんだと思います。

 

 

4.2 対策と心構え

 

仕方のないことですが、二次創作側の心構えとしては、ウェブにアップロードした時点で誰でもアクセスできるものという割り切りが必要です。ただしpixivなどSNSへの投稿を避けることで、研究対象とされる確率を若干下げることは可能かもしれません。例えば全年齢作品はpixivに投稿し、R18作品のみ、ぷらいべったーや個人サイト・ブログ(検索避け済み)へ投稿するなどすれば、分析対象とするには手間がかかるため、避けられる可能性はあります(あくまで可能性です)。

ただ、現状として一番簡単なのはマイピク限定にすることですね。R18作品の索引を作成している人もいましたので、段々こういった形での公開方法が普及していくかも知れません。

 

あるいは、英語圏のようにファン作品を研究する際のガイドラインを設けるのも一案かも知れません。

あるいは、英語圏のファンコミュニティ学術誌(TWC)のように、研究する際のガイドラインを設けるのも一案かも知れません。

Submissions - Author Guidelines


◾︎2017/07/06追記

以下の表現が誤解を招きかねなかったため修正しました。

 

「あるいは、英語圏のようにファン作品を研究する際のガイドラインを設けるのも一案かも知れません。」

→「あるいは、英語圏のファンコミュニティ学術誌(TWC)のように、研究する際のガイドラインを設けるのも一案かも知れません。」

 

二次創作研究についてのガイドラインを定めているTWCは、ファンコミュニティや二次創作を研究対象とするため、このようなガイドラインが設けられているようです。英語圏の研究者全員がこのようなガイドラインを念頭に置いているかは未確認です。

 

英語圏の同人研究倫理指針『英語圏ファンスタディーズ(fan studies) 学術誌TWCの研究者のための倫理指針』


ガイドラインということであれば、研究者側、特に今回問題になった人工知能学会には、ネット上の個人の創作物やSNSの投稿を扱う際のガイドラインを設けて欲しいと思います。

 

変わったところでは、pixivに投稿したテキストをコピーしづらくするというアイデアも。技術的に解決ができるのであれば「うっかり」も防げて確実かもしれないですね。

 

小説投稿サイトでの本文取得防止に関する思いつき

 

また、二次創作者はざっくりでも構わないので著作権法を知っておけば、損にはならないはずです。

1分間でわかる著作権法(初心者向け)

 

 

4.3 二次創作、ウェブ上の個人の投稿を対象とする研究について

 

今回の件を受けて、類似の研究が下火になることは望ましくありません。研究において個人の投稿するデータはとても有意義で興味深い研究対象となるはずです。だからこそルールの整備が必要ではないでしょうか。

また、研究対象となることを恐れてウェブ上の二次創作投稿が敬遠されることもまた望ましくありません。二次創作側も研究者側も萎縮するのは最悪のパターンです。

また、著作権的に問題はないから騒ぐ方が馬鹿だというのも違います。法律的に問題がなければ何をしてもいいわけではなく、むしろ法律的に問題がないのは大前提です。大体、研究対象がなくなって困るのは研究者側なのですし。

 

 

5 おわりに

 

二次創作をやっていて、学部生として研究にちょっと首を突っ込み、収入とか人生設計とか全く考えなければ研究職もアリだよなーと思っていた人間としては、「なんてことをしてくれたんだ!」と怒りを通り越して悲しさを覚える出来事でした。何が悲しくて、こんな出来の悪い予稿のせいでランキング上位の作者が嫌な思いをしなければいけなかったのか…。と同時にウェブへの二次創作の投稿についても改めて課題はあると思いました。

 

ただ、奇妙な共通点があるのが興味深いです。BL含む二次創作側も、研究者側も、互いに誰もがアクセスできる環境に作品(論文)を置いているにも関わらず、まさか自分の作品(論文)が分野外の人間に取り上げられるとは思ってもいなかっただろうこと。タコツボ化したローカルな世界同士が接触したのが今回の出来事だったのではないでしょうか。

 


2017/07/08 追記

と書きましたが、論文は不特定多数の人間に読まれるのを念頭に置いているのが前提ではありますね。一応。


しかし、1ヶ月以上経っても経過についての公式な声明がどこからも出ていません。このまま何事もなかったかのように済まされてしまうのでしょうか…。忘れてしまうことが一番よろしくないので、今後も注視していきたいと思います。

 

 

6 参考にしたページ等

 

この投稿の中で一番有用なのではという気もします。なお、以下のページ上の意見への支持を意味するものではありません。

 

@LazyWorkz https://twitter.com/LazyWorkz/status/875015865732710401

@pixiv https://twitter.com/pixiv/status/867650073047453696

@zin_zin https://mobile.twitter.com/zin_zin/status/867653724507951104

[web][性]「成人向け同人小説」を研究対象にする場合の問題について【追記ありhttp://d.hatena.ne.jp/font-da/touch/20170526/1495783027

「pixiv論文」に絡む、著作権的にグレーなものは他のいかなる権利の侵害も訴えられないのか? という疑問 https://togetter.com/li/1114409

「学会の全国大会」って、なんだ? - BL作品を題材とした人工知能研究が炎上した件から https://news.yahoo.co.jp/byline/miwayoshiko/20170529-00071436/

「問題があったか?」の問いに、「どうなんでしょうね」 人工知能学会大会発表論文の執筆者を直撃! pixiv上のR-18小説に猥褻・有害の「レッテル貼り」で騒動に https://news.infoseek.co.jp/article/otapol_222551/

「予稿」と「「学会の全国大会」って、なんだ?」(Yahoo!ニュース個人):続々「文章フィルタリング研究」案件に関する私的メモ~情報学の研究と文化人類学的な調査手続きに関する話 Part3~ http://naka3-3dsuki.hatenablog.com/entry/2017/05/29/230500

立命館Pixiv論文問題」とやらは別に腐女子の問題じゃない https://getpocket.com/a/read/1763856807

立命館大学の論文がpixivのR-18小説を晒し上げている!」という意見に対する反論など https://togetter.com/li/1113881

【2017.05.25】立命館大学がpixivの公開制限R18作品を「猥褻・有害な表現」として無許可で公表した論文について(随時更新) https://togetter.com/li/1113782

【2017.05.25】立命館大学がpixivの公開制限R18作品を「猥褻・有害な表現」として無許可で公表した論文について(随時更新) https://togetter.com/li/1113782

【2017.5.28_1710更新】情報学の研究と文化人類学的な調査手続きに関する話 Part1~「文章フィルタリング研究」案件に関する私的メモ~ http://naka3-3dsuki.hatenablog.com/entry/2017/05/26/190500

【2017.5.31_1400追記】「文章フィルタリング研究」案件の大学院の現場とその周辺の話~情報学の研究と文化人類学的な調査手続きに関する話 Part4~ http://naka3-3dsuki.hatenablog.com/entry/2017/05/31/014000

【pixiv論文】日本文学研究者が引用について語ってみる http://lite.blogos.com/article/225608/

【pixiv論文】批判方法を間違うと創作も危険という呼びかけ(随時更新) https://togetter.com/li/1114406

【時事】【ネット】同人BL小説が大学の研究論文に「無断引用」された件について http://amanoiwato.info/?p=1449

追記あり】「モラルを疑う」pixiv上のR-18小説を“晒し上げ” 立命館大学の論文が炎上 今後の対応は https://www.buzzfeed.com/jp/harunayamazaki/jsai2017-r18?utm_term=.tfNajr1Dl#.alAb1DWL5

pixiv サービス利用規約ガイドライン https://www.pixiv.net/terms/?page=term

Pixivからの小説引用問題の周囲で、二次創作と自由について考えを整理してた http://scriptlife.hacca.jp/blog/2017/05/28/trouble-novel-quotation/

pixivのR-18小説を「有害な文」 学会が論文取り下げ 「検討するため」 http://www.itmedia.co.jp/news/articles/1705/25/news137.html

pixiv論文のアレ https://twitter.com/i/moments/875967537380335617

Pixiv論文事件の収拾について思うことと匿名文化の限界 https://www.pixiv.net/novel/show.php?id=8233903

serio http://b.hatena.ne.jp/entry/339123655/comment/serio

どうすれば立命館大の論文発表は炎上しなかったのか http://kittens0w0kitchen.blog.fc2.com/blog-entry-6.html

ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング https://kaigi.org/jsai/webprogram/2017/paper-15.html

ネット上のコンテンツを対象にした研究の宿命と集合知 https://www.pixiv.net/novel/show.php?id=8241307

下山勝之 https://www.facebook.com/permalink.php?id=100007170789724&story_fbid=1905728789676129

現役研究者に論文引用について聞いてみた https://www.pixiv.net/member_illust.php?mode=medium&illust_id=63098250

作品のマイピク化についてのご報告https://www.pixiv.net/novel/show.php?id=8208593

小説投稿サイトでの本文取得防止に関する思いつき http://privatter.net/p/2455336

人工知能学会 立命館「pixiv論文」 炎上 ※追加情報あり http://open.mixi.jp/user/13150923/diary/1960644738

続・「文章フィルタリング研究」案件に関する私的メモ~情報学の研究と文化人類学的な調査手続きに関する話 Part2~http://naka3-3dsuki.hatenablog.com/entry/2017/05/28/150500

著作・引用・心の自由 https://www.pixiv.net/member_illust.php?mode=medium&illust_id=63276549

二次創作小説を研究目的で引用することは研究倫理に反するか https://anond.hatelabo.jp/20170525145352

分析30:「立命館大学の論文」pixiv小説引用の問題点はどこにあるのか http://www.textmining-blog.com/archives/2141598.html

無題 https://anond.hatelabo.jp/20170526111713

立命館pixiv事件のもたらした被害は結構大きい https://anond.hatelabo.jp/20170528080208

立命館pixiv論文の問題点を整理する http://blog.livedoor.jp/kudan9/archives/51359186.html

立命館とかpixivとかの件に関する問題整理と私見(どっちもどっち)。 http://ishijimaeiwa.hatenablog.jp/entry/2017/05/26/041048

立命館の「猥褻文フィルタリング論文」問題について思うこと https://togetter.com/li/1114086

立命館のpixivに関連する論文について建設的な方向性のために https://americanpresidentsinfo.blogspot.jp/2017/05/summary.html?m=1

立命館の論文について書き手側から思うところ https://togetter.com/li/1114942

立命館大・近江龍一氏の学会報告プロシーディングを拝読しての感想 https://www.pixiv.net/novel/show.php?id=8234932

立命館大学 pixivのR18小説を論文に引用して有害のレッテル貼りと晒し上げで大炎上 https://matome.naver.jp/odai/2149564479015738601

立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか https://news.yahoo.co.jp/byline/soichiromatsutani/20170527-00071377/

立命館大学論文引用についての解説漫画がわかりやすい+指導教授は元々問題のある人物だった? https://togetter.com/li/1115147