2015-08-01から1ヶ月間の記事一覧

Laravel4をCentOS6+nginx+PHP5.4でインストールする

PHP

最近人気があるLaravelを使うためのメモです。 【環境】 CentOS release 6.7 (Final) PHP 5.4.44 composerからLaravelをインストール composerを入れてない場合は以下のコマンドでインストール。 $curl -sS https://getcomposer.org/installer | php $mv com…

PHPで文字化けせずにCSVファイルを読み込む方法

PHP

CSVを読み込むと「文字化けしている…」ってことがよくありますよね。そんな時の対処法です。 文字化けせずにCSVファイルを読み込む まず、SplFileObjectでCSVファイルを読み込みます。 fgetcsv()でもいいのですが、参考にさせて頂いた「【PHP】その CSV 変換…

PHPでスクレイピング&本文抽出をする方法・ライブラリ

PHP

引用する記事のタイトル&本文の抜粋を取得したい! ということで、PHPでスクレイピング&本文抽出する方法を調べてみました。 [amazonjs asin=“4839956472” locale=“JP” title=“実践 Webスクレイピング&クローリング-オープンデータ時代の収集・整形テクニ…

Mecabにユーザー辞書を導入する(はてな、Wikipedia、ニコニコ大百科など)

PHP

Mecabにはてなキーワード、Wikipedia、ニコニコ大百科などを元にしたユーザー辞書を追加します。公式マニュアルはこちら。 ユーザー辞書を追加する流れは、 1.元データを取得してCSVファイルに変換 2.CSVファイルを辞書ファイルにコンパイル 3.Mecabの設定フ…

Mecabなど形態素解析で使うIPA品詞体系(品詞ID|pos-id)

PHP

Mecabや茶筅など形態素解析で使う辞書のIPA品詞体系をまとめてみました。 Mecabでは::getPosId()で品詞IDを取得できます。 [amazonjs asin=“4873114705” locale=“JP” title=“入門 自然言語処理”] IPA品詞体系 品詞ID 分類 例 説明 0 その他,間投 「あ」「ア…