2010-11-29

Windows 7でのWP2TXTのインストール方法

Wikipediaのxml形式のダンプデータを解析できるWP2TXTをWindows 7で使おうと思ったら、素直にインストールできなかったのでメモ。

  • 1.インストール


  • http://rubyforge.org/projects/wp2txt/からWindows版のWP2TXTをダウンロードし、.exeを実行。

  • 2.zlib1.dll


  • そのまま実行しようとするとxlib1.dllがないって怒られるので下記からダウンロードしてWP2TXTの実行ファイルと同じ場所に置く。

    http://www.nodevice.jp/dll/zlib1_dll/item613.html

  • 3.msvcp71.dll, msvcr71.dll


  • これも必要だって怒られるのでこれもzlib1.dllと同様の場所に置く。

    http://www.vector.co.jp/download/file/win95/util/fh435079.html


    これで起動できるはず。

  • おまけ


  • 使い方は簡単。

    Input FileにWikipediaのbz2ファイルを指定(解凍しながらxmlを解析しているらしい)
    Output Dirを適当に指定

    Size of Each Output File (MB)で出力データを指定MB毎に分割できる。

    Elements Extractedで抽出する要素を指定。(Title, Heading, Paragraphなど)
    注釈で使われている<ref>を含めるかどうかなどの設定。

    設定が済んだらSTART。
    jawiki-latest-pages-articlesだとだいたい1時間くらいかかる。

    終わったテキストはWikipediaの編集で使われているWiki記法で出力されています。
    あとは煮るなり焼くなり。


    応援クリックお願いします!!人気blogランキングへ

    2010-11-14

    Android覚書き 導入編1

    Android始めたので、色々と覚書き。


    ▼Eclipseに新規ソフトウェアのインストールでADTプラグイン入れる。
    http://dl-ssl.google.com/android/eclipse/

    ▼Emulatorの設定
    ウィンドウからCreate new Android Virtual Deviceを選択
    新規>名前を入力>ターゲットを選択
    Google APIs(google Inc.) - API Level x
    (xはADK2.2なら8、1.6なら4にする。)


    ▼AndroidSDKにはサンプルがいっぱい!
    ・新規Androidプロジェクトを作成する
    Create project from existing sampleをチェック
    サンプルを選択
    プロジェクト名をつけて実行


    ▼デバッグはADKを利用して行う。
    ・Eclipseからのデバッグ手順
    実行>デバッグの構成>Androidアプリケーションの新規構成
    名前をつけて作成したAndroidプロジェクトを選択
    デバッグ!

    ・ADKバージョンを変える場合は
    実行>デバッグの構成>Androidプロジェクトのデバッグ構成を選んでターゲットタブからADKを選ぶ


    ▼サンプルの中身とか
    ・src
    javaファイルなど
    ・gen
    R.java:作成するアプリで利用するリソースのIDなどを割り振るファイル。自動生成されるため、編集はしない。
    ・res
    /drawable 画像などのリソース
    /layout XMLのレイアウトファイル
    /values 各種の値用のディレクトリ
    /assets Webページのリソースを格納するためのディレクトリ
    ・AndroidManifest.xml
    アプリケーションの実行用設定ファイル


    ▼ApiDemosパネェっす
    ApiDemosには200以上のデモが入っていて、Androidで使えるAPIの動きとソースコードを確認したい場合はすごく重宝しそう。

    App:アクティビティー(Windowsでいうウィンドウ画面のようなもの)、ダイアログ、メニュー、OSの通知機能など
    Content:コンテント(ファイル操作など)
    Graphics:画像描画
    Media:音楽再生と動画再生
    OS:センサーの動作確認
    Text:文字列表示
    Views:ボタンやリスト、レイアウトなどのユーザーインターフェース部品



    応援クリックお願いします!!人気blogランキングへ