地上最強のブログ

しばいてくぞ

資料保存のこと (2)

 

前回の記事から

ところで、19世紀頃以前の出版物をスキャンしたものが、再版や復刻海賊版になって出回っているものである。こんな話に用がある人間など文系研究者にしか居ないしその文系研究者がウェブ利用に疎いから、こういったことに関して知識が有って発言していく人がこの世にほとんどいない事になる(ありとあらゆる文献がGoogle Books化しているという想像を絶する情報量の世界なのだが)。例えば、こんなような、かかる海賊出版を指摘する単発的な文章があるのみ。ここに書いている「Nabu Press」など、実際何冊か買ってしまっているが、Google Books(のPDFファイル)をそのまんま印刷してそれにン千円という値段を付けて売っているものである。ええ商売してまんな。(20台の時、メキシコや上海で、当地流行の曲の入ったC

“好き

“好き"のたね(SHOWROOM選抜)

  • AKB48
  • 発売日: 2018/09/19
  • メディア: MP3 ダウンロード

Dを路上販売で何十枚と買って甘露甘露だったものだが、これなども、二束三文のCDに焼いただけのものを値段(これも二束三文だが)付けて売っているのである。12年前の記事があるが、たしかにこんなのである。)

で、Google Booksだが、欲しい文献を、作品名や出版年や出版社の名称と「Google Books」を組み合わせてググって見つける(なお、普段Gooleを使ってない人は即改めるように。Yahooというのは子供のオモチャである。学術者が使う検索エンジンではない)。例えばゴットシェートの作品など現代組版で出版されていないが、なんでもいいが例えば『Grundlegung einer deutschen Sprachkunst』が欲しかったとしたら、現時点でUlan PressとNabu Pressから海賊版も出てるが、そんなものは無視して、「Grundlegung einer deutschen Sprachkunst Google Books」でググるのである。書名がかなり特定的だから、著者名はいらない。ただしこれだけだと、同書名ページが沢山ヒットしてしまって戸惑うばかりだ。そこで、典拠のページを見て、「1748」を足せばいいと分かる。そうしてググると、このように見つかる。そして、左側の赤いタブにマウスをマウスオーバーして、出てくる文字列の中の「PDF」というのをクリックする。あとは何ステップかでDL出来る。これでGottschedの『Grundlegung einer deutschen Sprachkunst』が手に入る。それは電子媒体として確かに文字通り「手中にしている」「所有している」。

あとは、HDDなりUSBフラッシュメモリなりに保存したらいい。特にフラッシュメモリを何個か買って分散して保存しておいたら安全だ(10年前に1万円だった32GBが今では約900円(2019年8月28日19:31)だ。何という時代だ!!!)。108均でCD-Rを買ってきてもいい。クラウドなど腐るほど有る!!これがネット上で出来ることだ。もちろん、氷山の一角上の1雪片の1結晶ほどのことでも無い。これの100兆倍いや100那由他×100阿僧祇倍のことが、ネットでは、出来る。

また、例えばクライスト研究者が多いだろうが、Berliner Abendblätterなど現代組版が存在しない。じゃあどうしたらいいか。海賊版?復刻版?バカな。まずこのリンク先を見よう。「Reprints」の項に、やはりPDFで当時の出版物として入手できるこのページに飛ぶようにリンクが貼ってある。この「インターネットアーカイブ」でDLするPDFはファイル内検索非対応のうんこファイルだったりするのだが、今のところはここしか見つからない。ただ、ファイル内検索非対応だというだけで、Berliner Abendblätter全紙が自分のモノとなるのである。

今書いた2例のケースをもとに、欲しい文献を自身でググると、その丸ごと全部が、 版権 著作権切れているものであるなら、電子媒体の形で手に入る。

音が出ないギター

音が出ないギター

  • 乃木坂46
  • 発売日: 2014/04/06
  • メディア: MP3 ダウンロード

 

さて何の話だったかと言うと、チーム8のセンチメンタルトレイン(リンク予備①・リンク予備②・リンク予備③・リンク予備④)とその坂口渚沙の話だった。… ウェブ上でGoogleから文献PDFをダウンロードするという話でした。これは、世界中の(だろう)図書館(だろう)でスタッフだろう人々が文献をスキャンしているものだが、このスキャンするというのは、ようするにどんな本ででも出来るのだから、自分ででもやればいいことなのである。存在するどんな文書でもスキャンできるし、紙に限らず魚拓でもパイ拓でも疾風伝説でも作れるし、自分個人内利用に限るなら、読んだ本をスキャンして手元に置いておいていつでも参照することができるしタブレットに入れておけば読書できる。数万円のタブレットもいいが、Amazonひも付きタブレットのFireなど、2019年8月28日19:44現在で5980円と爆安である。自分はこれの前のモデルを2018年4月25日 にタイムセール3480円で買ってる。4次元ポケットからも出てこなさそうなデバイスがバイト日給半日ちょっと分の金額で買える時代だ。それも7で十分。8以上はいくら高性能でも片手で持ちにくいようで携行使用に不便。

そう、文書・文献・資料・書籍は、それをうず高く誇らしげに積み上げる時代はもう終わっており、電子媒体―要するにPDFファイルにしてしまってゼログラム・ゼロスペース・ゼロベース革命の丘で所有してしまう時代なのである。単行本1冊が100MBとすると、10TBのHDDに10万冊が入る。研究者の一生に必要な量の10倍か10分の1だろうが、いずれにせよ、HDDの10TBとは、前回記事で書いたBarraCudaなら現在4万142円である。10万冊を収める本棚は、一体何十万円かかるのだろうか。置き場所は確保できるものなのだろうか。しかもどの本も電子ファイルのように整理しやすく取り出しやすくはないだろう。書棚の価格は下がらないだろうが今後HDDいやさらにSSDの価格ときたら下がる一方だ。本は破損喪失焼失等のリスクに常にさらされるが、保存媒体を分散すれば電子データは限りなく安全である。しかもクラウドの時代だ。Googleドライブ10TB年額15万6000円と、経年劣化もし埃もかぶる数十万円の書棚と本の山と、どちらがトクだろうか。

それでも大方は本とかいう厄介な物品を所有したがるのだが、これは自分が物体バイアスとも言うべき認知エラーに起因する病(認知バイアスは188あるがまだまだ見つかるだろう)で、書いてある事=コンテンツに用があるだけなのに本として物として手に取れるとヘンに安心してしまうのである。純然たる錯覚である。情報は情報だ。

自分が使っているのがエプソンGT-S650というスキャナーだが、2016年5月上旬に買った時には8963円だったのが現時点で8337円になっていてそういった価格変動にも注意が必要だがとにかくこんなのを1台買っておけば十分。まず5年前後は持つだろうからその間にあんな書籍こんな書籍をぶんぶんスキャンし放題だ。こんなことはさすがに文系研究界で認識されており、買った本は次から次からスキャンする研究者や、スキャンするためにためらわず裁断してしまう研究者も居る。

このGT-S650だが、写真を扱うぐらいのレベルの代物だから9000円近くもするのだが、これはケチらんでよかったことが後に判明する。スキャナーは金に糸目を付けずに買ったほうがいい;どうせ元を取りすぎるぐらい取るのである(と言って別に安物というのもAma上ですぐには見つからないのだが)。何が言いたいかというと、プリンターと一体型のスキャナーの別に旧型でも安物でもないもの(使用時2017年時点)を使ったことがあるが、それはヒドいもので、仕様のしょぼさは固より、悪夢のような低画質なのである。よって1万以上のスキャナー自体を買うのが得策になる。で、このGT-S650だと、「グレー」の300dpiに設定してスキャンしたら書籍見たままに近くしかもテキスト検索も付けれれる(それ以上の品質でスキャンして容量デカくなりすぎるのも問題)からこれでスキャンすることになるのだが、その辺は、自身で買ったスキャナーによって、容量と相談しながら、いや何よりもグ

Green Flash

Green Flash

  • AKB48
  • 発売日: 2015/03/04
  • メディア: MP3 ダウンロード

グって色んな記事を参考にしながら、試行錯誤してdpiやカラーやその他の設定を決めていくことになる。(とは言え、モノ黒あるいは白クロのスキャンだけはさすがにやめといたほうがいい。本当に字たる字だけが画像化されることになる。まあ詳細はggrks。)スキャンの手間だが、自分だと、『詳解ドイツ大文法』、それ以上にAndreas Heusler: Deutsche Versgeschichteが一番時間がかかったが、頁数からしてそりゃそうだ。もし買った本でも裁断できると言うのなら、したほうがいいだろう。ペラペラの紙をスキャンしていくのは著しくラクであるし、本を押さえ付けるのと違って平らで綺麗な面になる。そりゃそうだ。