2013-12-10

Groovy で JVM ログ解析 (ClassHistogram編) #gadvent #java

Groovy で面倒な JVM ログを解析する (ClassHistogram)

前置き

この記事はG*(Groovy, Grails ..) Advent Calendar 2013 - Qiita [キータ]の10日目です。
前日は研究室の先輩 @tetsurokitaharaさんのGracenote with Groovy でした。

JVM(hotspot) は好きですが Java は余り書かず、作りこむなら Scala、速度が欲しいなら C、ログの解析なら awk/sed、Ruby 等で済ます日々ですが、Java のログなので Groovy でさっと処理してしまおうと考え取り組んでみました。どうせなので groovysh で扱える仮想配列として出力し、後々好きな様に加工できるようにしました。
この題目は7日目の@nobusueさんのGroovyでGCログ解析と多少被ってますが、別のログが対象ということで許してください＞＜

JVM ログで出力される ClassHistogram とは

一般的には OutOfMemoryError が発生した場合などで利用するクラス統計情報で、現在実行中の Java プロセスに存在する各クラスのインスタンス数、バイト数が含まれています。
JVM 起動オプションに -XX:+PrintClassHistogram を指定し、SIGQUIT (kill -3 ) を送出すれば以下のようなログが出力されます。

num   #instances    #bytes  class name
--------------------------------------
  1:     24868     3398080  <no name>
  2:     24868     2598976  <methodKlass>
  3:      2813     2432352  [I
  4:      1970     2415680  <constantPoolKlass>
  5:      1970     1873040  <instanceKlassKlass>
  6:      1873     1661760  <constantPoolCacheKlass>
(中略)
1105:         1          16  sun.reflect.GeneratedMethodAccessor3
1106:         1          16  sun.awt.X11.XProtocol$1
Total   172945    22390368

これを間隔を置いて複数回出力させれば、各クラスが時系列にそってどのように増減しているかが調べることが可能です。解りやすい例だと、あるクラスのバイト数が常に増大していれば、明らかにそのオブジェクト(を生成している部分)でメモリリークを起こしてることが判明します。
このログで面倒なのは、複数クラスローダが存在する場合です。クラスローダAとクラスローダBで同じクラスがロードされていると、それは別物扱いなので同じクラス名の情報が重複して出力されます。その上このログからはクラスローダ情報はばっさり捨てられてるので、今回は同じものとして加算しています。

ログから各クラスの時系列ごとの統計情報を解析する

というわけで仮想配列を出力するコードです。実は何気に殆ど初 Groovy だったりするので所々酷いところがあると思います。。

一枚目の gist のコードを保存し、二枚目の gist の通り groovysh で呼び出して仮想配列として出力できます。その後は、例えば以下のようにすればクラス一覧を出力しつつ、各自系列ごとのランク、インスタンス、バイト数情報が引き出せます。

import static ClassHistrogram.*
ch = calc("*log")
ch.each{ klass, timeline ->
  println "{${klass}:"
  timeline.each{ time, value ->
    println "  {${time}:{rank:${value[0]},instance:${value[1]},byte:${value[2]}}}"
  }
  println "}"
}

---出力例---
{sun.java2d.pipe.LoopPipe:
  {0:{rank:1040,instance:1,byte:16}}
  {1:{rank:1057,instance:1,byte:16}}
  {2:{rank:1071,instance:1,byte:16}}
  {3:{rank:1079,instance:1,byte:16}}
  {4:{rank:1079,instance:1,byte:16}}
  {5:{rank:1081,instance:1,byte:16}}
  {6:{rank:1082,instance:1,byte:16}}
  {7:{rank:1079,instance:1,byte:16}}
  {8:{rank:1078,instance:1,byte:16}}
  {9:{rank:1078,instance:1,byte:16}}
  {10:{rank:1078,instance:1,byte:16}}
}
---

このように LTSV 形式に出力するのもよし、CSV ファイル形式に出力や特定クラスの情報だけ引っこ抜くのも良しで、加工しやすいのではないかと思います。

以上です、次は https://twitter.com/setoazusa:title@setoazusa さんの番です！

2013-09-15

「Java解析ツールバトル」に登壇しました＆ HeapStats の動かし方について #jjug

JJUG ナイト・セミナー「Java解析ツールバトル」に HeapStats 陣営でコミッターとして参加してきました！

今回のJJUGでは、自分達の JVM に深く密着してパフォーマンスに心血を注いでいる HeapStats、最近 OSS 化された Java だけでなく SQL 実行計画まで総合的に診断する EndoSnipe、昨日の OracleJDK 7u40のリリースで公式に JDK に付属された Java Flight Recorder と twitter4j の開発者であるモデレータが過去に開発された侍の四三つ巴でディスカッションを行いました。
数々のプロジェクトやサービスで利用されている Java だからこそ、障害や性能問題に悩まされる人の数も多いと思われます。障害解析の手助けになるツール、それも今回参加した３つの内２つは日本人によって開発されていることもあり、かなりの盛況ぶりだったと思います:)

自分達のHeapStatsの発表資料はSlideshareで公開しています。興味のある方はぜひご覧ください。

HeapStats（Java解析ツールバトル） from Yasumasa Suenaga

ディスカッションでは時間の関係上、駆け足での説明だったため、「HeapStats はどうやって動かすの？」という最初の一歩をもう少し詳しく補足していきたいと思います。

HeapStatsのインストール

HeapStats インストール条件

性能に心血を注いだ結果として、JVMに手を突っ込み、一部のコードをアセンブラ化している等が原因で、HeapStatsを動かすためには以下の環境である必要があります

HotSpotであること
- OpenJDK 6以降, あるいは OracleJDK 6以降
- OpenJDK の場合は debuginfo パッケージもインストールする必要があります。
x86 または AMD64 の Linux であること
- RedHat Enterprise Linux, Fedora, CentOS, 等。

HeapStats インストール＆動作方法

HeapStats をインストールするためにはバイナリからインストールする方法と、ソースからビルドする方法があります。今回はバイナリからインストールする方法を紹介します。

バイナリをここから取得してインストールする。
- $ rpm -ivh heapstats-agent-[version].[CPU命令セット].[Linux dist].[アーキテクチャ].rpm
- CPU命令セットの部分は解らない場合は何も記載されていない物を利用して下さい。
  - 利用している環境がサポートしているCPU命令セットを確認したい場合、"/proc/cpuinfo" の "flags" を見ることで確認ができます。
  - avxが書かれている場合はavxを、avxはないがsse4が書かれている場合はsse4を、それ以外は無印を利用するのがお勧めです。
- Linux dist の fc は Fedora, el は RedHat Enterprise Linux を指します。
監視させたい Java プログラムの起動オプションに以下を追加して実行する。
- -agentlib:heapstats
- 既に動作している Java プロセスに対してアタッチする場合はこちらを確認して下さい。
実行ディレクトリに heapstats.csv, heapstats.dat が出力される。
- analyzer を利用して可視化が行えます。
- 出力フォルダは設定ファイル /etc/heapstats/heapstats.conf (デフォルト) を編集することで変更できます。

以上で HeapStats は実行している Java プロセスを常時監視しつつ各種情報を取得し、故障発生時には解析に必要な情報を根こそぎ取得するようになります！

HeapStatsの各種設定やアナライザによる可視化は公式サイトをご確認下さい。日本語サイトも準備されています！

2013-06-09

公式配布のソフトウェアだけでWindowsでMOVファイルをWMVファイルに変換する方法

不慣れな人が動画変換をする場合、無料でやるためによく解らないフリーウェアを入れて変換することが多い。しかしMOVからWMVに変換するだけなら、公式で配布しているソフトウェア(無料)で変換することができた。検索してもやり方が見つかり辛いので備忘録として残す。

MP4(H.264)に変換したい場合は、餅は餅屋ということでここらへんを参考にすると良い。

前準備

Microsoft Expression Encoder 4 を入手して、インストールする。
- 環境によっては.NET Framework 4.0や、Silverlightのインストールが求められる。それぞれのダウンロード先は表示されるので手順に従ってインストールする。
Quick Time を入手して、インストールする。
- Expression EncoderだけではMOVファイルを認識できないが、Quick Timeをインストールすれば認識できる。

これらのソフトウェアは有料(Pro)版も販売されているが、無料版も用意されているのでそれを使う。上記リンク先は全部無料版なので、ここでは気にせず導入すると良い。

変換

Microsoft Expression Encoder 4を起動する。
画面下部のメディアコンテンツ欄に変換したいMOVファイルをドラッグ＆ドロップする
エンコードボタンを押す。
1. 変換形式を変えたい場合は、画面右側のエンコードタブの出力形式から選ぶ。
エンコードが完了したら、画面右側の出力タブをクリックする。
真ん中あたりにあるジョブ出力のディレクトリ先に変換済みのファイル場所が表示されているので、そのディレクトリを開けば変換済みファイルがある。

Enjoy :)

2013-05-20

JavaでFull GCを実行する方法

Full GCを任意のタイミングで実行させ、負荷の高い処理に備えておくという戦略を取りたい時がたまにあります。基本的にはチューニングで解決すべきですが、緊急or暫定策の備忘録として。

jmap -histo:live <pid>

LinuxはJDK5から、WindowsはJDK6から利用可能。生存中のオブジェクトのみ抽出したメモリーマップを作成するために、直前にFull GCを実行するのでこれを利用する。
対象のJavaプロセスを実行しているユーザで実行する必要があるので注意。

jcmd <pid> GC.heap_dump <output_filename>

Linux、WindowsともにJDK7から。これも上のjmap -histo:live と同じく、生存中のオブジェクトのみ抽出するためにFull GCを実行する。これもJavaプロセス実行ユーザと同じユーザで実行する。

Full GCを実行する機能について

JDKでは、恐らく上記の生存オブジェクトのヒープ情報を取得する(HeapInspection)場合でしか、明示的にFull GCを実行する方法は準備されていないと思われる。
実際に呼び出されるコードは以下。

./hotspot/src/share/vm/gc_implementation/shared/vmGCOperations.cpp
VM_GC_HeapInspection(outputStream* out, bool request_full_gc, bool need_prologue)から以下を呼ぶ
VM_GC_Operation(0 /* total collections, dummy, ignored */,
                GCCause::_heap_inspection /* GC Cause */,
                0 /* total full collections, dummy, ignored */,
                request_full_gc /* live=true, all=false */)

GCを起動させる方法(追記)

以下はGCが実行され、条件によってはFull GCが呼ばれる。これは上のVM_GC_Operationとは別ルートで、この記事のコメントにあるルートで呼ばれる。条件については未確認なので注意。条件についてはとは書いているが、基本的に Full GC になることを期待できる…はず。

Runtime.getRuntime().gc() / System.gc()
jcmd <pid> GC.run
jconsole の「Perform GC」ボタン

以下は上のJVM_GC_OperationでFullGCがリクエストされない形で呼ばれるため、普通のGCが起動される。GCなのでヒープ状況次第ではFullGCも呼ばれる。

jmap -histo <pid>

2013-05-16

Java SE 7 JavaDoc 日本語版公開

前回の記事でJava SE 7 の日本語版 JavaDoc は公開されていないと書きましたが、先日の Java Day Tokyo 2013 で公開されました！
なんてタイミングだ＼(^o^)／

ともあれ大変喜ばしい事です。一部英語の部分もありますが、順次アップデートされるそうです。日本オラクル社と寺田さんの尽力に感謝します！#てらだよしおあいしてる

Java SE 7 JavaDoc公開先：http://www.oracle.com/technetwork/jp/java/javase/documentation/

2013-05-12

OpenJDK 8 をFedora18でビルドする

OpenJDK と戯れるため、OpenJDK ビルド用サンドボックスとして、まっさらな Fedora 18 (x86_64) 環境を用意してビルドしてみました。
以下、再構築時のための覚え書き。

Fedora 18

Fedoraはこちらのページから好きな形式で落として、KVMなりXenなりVMwareなりにインストールする。
VMWareにインストールする場合は、仮想マシン設定のディスプレイから3Dグラフィックスのアクセラレーションをオフにしないとフリーズするので注意。

インストールが終わったら前準備として環境設定を一通り実施する。

# sudoの設定
su -
visudo
# 以下を追記する。hogeは適当なユーザ名に変更する。
# hoge	ALL=(ALL)	ALL
# %wheel	ALL=(ALL)	NOPASSWD: ALL
exit
# 必要に応じてキーボードを日本語入力に
sudo setxkbmap jp -model jp106
# 必要に応じてプロクシを設定
vi ~/.bashrc
# 以下を追記する。
# export proxy=xxx.xxx.xxx.xxx:xxxx
# export http_proxy=xxx.xxx.xxx.xxx:xxxx
# export ftp_proxy=xxx.xxx.xxx.xxx:xxxx
source ~/.bashrc
sudo vi /etc/yum.conf
# 以下を追記する。
# proxy=http://xxx.xxx.xxx.xxx:xxxx

これでFedora18の最低限の設定が完了。

OpenJDK8

続いてビルドに必要なパッケージを導入しつつ、OpenJDK8の最新版を入手してビルドする。これは時間がかかるのでシェルスクリプトとして実行するのが良い。一度実行してしまえばあとはビルド部分のみで済む。

#!/bin/baash

# ソースコード取得するための hg(mercurial)導入
sudo yum install -y hg
# 最新のOpenJDK8のソースコード取得
hg clone http://hg.openjdk.java.net/jdk8/jdk8 openjdk8
# ビルドに必要な関連プロジェクトのソースコード取得
cd openjdk8
./get_source.sh

# ビルドに必要なパッケージ等のインストール
# Fedora標準はJREのみのため、Boot JDK用に jdk7u7 以降のJDKを導入する。
sudo yum install -y java-1.7.0-openjdk-devel
# ビルドに必要な諸々のパッケージインストール (ないとconfigure/make時にエラー)
sudo yum install -y libXtst-devel libXrender-devel cups-devel freetype-devel alsa-lib-devel libXt-devel

# configuration
chmod +x configure
./configure
# ビルド
make all
# 動作確認(バージョン表示)
build/linux-x86_64-normal-server-release/jdk/bin/java -version

今回は特にオプションを追記せず、 make all でビルドしたが、色々なオプションがあるので Makefile 等を参照すると良い。

unnamed

Javaとか、http://twitter.com/sugarlife

Groovy で JVM ログ解析 (ClassHistogram編) #gadvent #java

Groovy で面倒な JVM ログを解析する (ClassHistogram)

前置き

JVM ログで出力される ClassHistogram とは

ログから各クラスの時系列ごとの統計情報を解析する

「Java解析ツールバトル」に登壇しました＆ HeapStats の動かし方について #jjug

HeapStatsのインストール

HeapStats インストール条件

HeapStats インストール＆動作方法

公式配布のソフトウェアだけでWindowsでMOVファイルをWMVファイルに変換する方法

前準備

変換

JavaでFull GCを実行する方法

jmap -histo:live <pid>

jcmd <pid> GC.heap_dump <output_filename>

Full GCを実行する機能について

GCを起動させる方法(追記)

Java SE 7 JavaDoc 日本語版公開

最新のOpenJDK8のJavaDoc (Java API) #yutori_history

OpenJDK 8 をFedora18でビルドする

Fedora 18

OpenJDK8

Groovy で 面倒な JVM ログを解析する (ClassHistogram)

前置き

JVM ログで出力される ClassHistogram とは

ログから各クラスの時系列ごとの統計情報を解析する

HeapStatsのインストール

HeapStats インストール条件

HeapStats インストール＆動作方法

前準備

変換

jmap -histo:live <pid>

jcmd <pid> GC.heap_dump <output_filename>

Full GCを実行する機能について

GCを起動させる方法(追記)

Fedora 18

OpenJDK8

Groovy で面倒な JVM ログを解析する (ClassHistogram)