東京電力が重要資料を“検索隠し工作”? 力が片仮名のカ トが卜(ボク) など → PDFの文字認識の問題じゃね? | あまえび速報
6ca2a898    bdb683c1

東京電力が重要資料を“検索隠し工作”? 力が片仮名のカ トが卜(ボク) など → PDFの文字認識の問題じゃね?

P020573_s

東電が検索隠し工作をしているのではと話題に。( ´・ω・)y─┛~~~oΟ◯


8e42a872-s

東京電力の力を片仮名のカ「東京電カ」や「ス卜口ンチウム」などの
隠語で検索すると、普段決して見ることが出来ない内部資料が
見れてしまうと大手掲示板で話題となっております。


そのような裏技があるのであろうか、早速検索を試みると確かに
PDFの資料など表に出てこないような資料が検索され閲覧も可能だ。
はたしてこれはどのような意図で流出しているのであろうか。

2

実際に検索してみますと確かに東京電力に関連するPDF文書が確認できます。
これが機密文書なのかそれとも公にしても問題ないものなのかは
明らかになっていないが「公開不可」と記載されているものもあるため、
何らかの形で流出して閉まっている資料ではないかと思われる。

―意図的に対策しているとの声もあるが



―PDFの文字認識による検索ミスの可能性



 
PDFは、テキスト文書と手書き文字の認識機能(OCR)の検索機能がある。
おそらくOCRの検索が誤って「東京電カ(片仮名のカ)」と
認識してしまった可能性がある。その結果が現在表示されているという
可能性だ。

また、エンジニアの小飼弾さんも「いずれもPDFなので、
インデクシング前のテキスト化の問題と思われ」とPDF文書に
関係する誤認識であると推測。

ただ、それら資料をオンラインに公開してしまって問題ないのかは不明だ。
ネット上にPDFを公開している方は是非とも同様の被害にあわないように注意したい。
http://www.yukawanet.com/archives/4690149.html

1
隠蔽かよ

いまさらだな

自動認識の問題だろ?放射脳には何言っても通じないと思うが

 
文字の自動認識機能に東電自身が騙されているという可能性。
もちろん、隠蔽の可能性も捨て切れませんが。( ´・ω・)y─┛~~~oΟ◯

P020514_s
 福島に「廃炉産業の街」構想 作業員ら5000人移住させひとつの街に
 



コメント

  1. 名無し

    何だ、OCRのせいか
    確かにカと力だったらカタカナのほうが優先されるんだろうな
    単語補完機能かなんかつけたら良さそうな感じだが

  2. 名無し

    非公開資料だったらマズイじゃん。隠蔽は困るけど。

  3. 名無し

    誤認とかじゃなくて単純な隠蔽だろ
    むしろこれを利用した隠蔽だろ。徹底的に糾弾して東電社員はもちろん一族郎党にまで徹底的に制裁しろ

  4. 匿名

    わざわざネットに公開して隠蔽?
    しかも力をカに変えるだけのお粗末な。
    アホかよ。

  5. 名無し

    すごーーーいwww朝鮮人みたいな隠蔽裏工作wwwwwwwwwwwwwww

  6. 名無し

    OCRしたことない人はわからないだろうな

  7. 名無し

    よくあるよ
    講義のプレゼン資料がむちゃくちゃになってることなんてしょっちゅう

  8. 名無し

    公開不可がこんなところにまでww

  9. 名無し

    「放射脳」でまとめて見下して悦に浸るのに必死な人ってかわいそう・・・

コメントを残す

メールアドレスが公開されることはありません。

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

post date*

アクセスランキング