パスワードを忘れた? アカウント作成
12377 story

偽論文判別プログラム 24

ストーリー by yoosee
スラドの記事は実はロボが編集しています 部門より

なんでも鑑定団曰く、"本家記事より、ランダム生成された情報学論文が国際会議に受理されるという話題を覚えている方も多いと思われるが、NewScientistの記事によるとインディアナ大情報学部の研究者が、それを判別するプログラムInauthentic Paper Detectorを開発したそうだ(2006 SIAM Conference on Data MiningへのProceedings[pdf])。テキストを入力すると、ランダム生成されたかどうかの割合(パーセント)を計算し、Inauthentic/Authenticを判別する。
ただ、NewScientistの別の記事が「人間が書いた可能性:32.1%」と判別されて記者を悲しませるなど、汎用性があるというわけでもない模様(あるいは記事が…)。 日⇒英の機械翻訳による文章では90%程度の結果が出た。自分で書いた英語の文章をチェックするのに役立つかもしれない。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 次は (スコア:2, おもしろおかしい)

    by Anonymous Coward on 2006年04月26日 13時04分 (#928704)
    判別プログラム向けに最適化された論文を自動生成するプログラムが(略
  • 部門名 (スコア:2, おもしろおかしい)

    by Anonymous Coward on 2006年04月26日 13時07分 (#928711)
    んなこと今更真顔で言われても・・・。
  • Captcha的に (スコア:2, おもしろおかしい)

    by MeeD (18266) on 2006年04月26日 13時40分 (#928749)
    逆チューリングテストとして各種サービスの登録時に小論文の提出を求められたらやだなぁ。

    しかもそれで弾かれた日にゃ人間の尊厳が…

    #弾かれないために校正支援ソフトの力を・・・あれ?
    • Re:Captcha的に (スコア:1, 興味深い)

      by Anonymous Coward on 2006年04月27日 1時26分 (#929151)
      その昔、理論値に誤差を加えて実験結果を捏造^H^H生成するプログラムを悪友が書いていました。
      レポートの結論には「理論値との差分 x%は計測誤差と思われる」とまとめてあったりして
      よくぞぬけぬけと・・・と苦笑いをした覚えが。
      親コメント
  • by Anonymous Coward on 2006年04月26日 15時04分 (#928789)
    インディアナ、嘘つかない。
  • by Anonymous Coward on 2006年04月26日 21時31分 (#929002)
    私の論文(海外の雑誌にAccept)のintroduction部分を入れてみました。

    でっかくINAUTHENTICと出ましたorz
    35.6%は人間が書いた可能性、だそうです。

    英語が下手なんだか、私がロボットなんだか。

    #一応AC
    • by kyousum (11338) on 2006年04月26日 22時27分 (#929045) 日記
      本家のコメントを読んだ所によると、どうやら同じ単語の繰り返しを重視しているそうです。introductionではなく、本文を全部入れれば、人間が書いたと判定してくれます。多分。
      --
      # For man might be free./人は自由になれるかもしれないから。
      親コメント
      • by Anonymous Coward on 2006年04月26日 23時52分 (#929092)
        元ACです。

        本文を全部入れたいには入れたいんですが、6割が数式なので、きっと文字の部分だけ入れると単語の繰り返しの割合が増えそうな気がします。
        手元にある英語の本でも打ち込んでみるか。
        親コメント
      • たぶん、ネイティブだと同じ内容のことを別の言い回し・単語を使う、ということなんだと思いますけど、
        だとすると、日本人式書き方では、全部機械的だと判断されるんじゃないでしょうか?
        仕様書でもなんでも同じ言葉を使いたがりますよね。

        日本語でも、古文だとワザといろんな言い回しをしていたような気がしますね。
        雅語とでも言うんでしたっけ(遠い記憶…)
  • by kei100 (5854) on 2006年04月26日 13時11分 (#928716)
    >スラドの記事は実はロボが編集しています
    そのロボに関する論文をロボに書かせて判定させてみたいものですな・・・

    # 編集と記述は違う事を解っていて書いているのでID
  • by Anonymous Coward on 2006年04月26日 14時51分 (#928781)
    研究者が別の大学に移っちゃったせいか、もうページ本体は存在しませんが
    レポート類似度判定システム [archive.org]
    とかいうのもあったようです。

    あと海外でも昔似たようなものが既に発表されていたような…
  • 今、巷で話題の成分分析 [google.co.jp]となにが違うの?
  • by Anonymous Coward on 2006年04月26日 13時05分 (#928707)
    文法的には正しいものをランダム生成した場合の判別はどれくらいになるか興味深いかも。
  • by Anonymous Coward on 2006年04月26日 23時54分 (#929093)
    データ少佐の発言は性格で論理的で感情を抑えたコメントです。
    これを入力した場合どのような結果が出るのでしょう。
typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...