燈明ブログ

現状は小池啓仁の応援ブログ

配列の要素をユニークにする!

Linuxのuniqコマンドみたいに配列変数の要素をユニークにしたい場合があります。
しかし、標準関数には残念ながら…そのような関数はありません。
またしかし、柔軟なPerlでは、ちょっと工夫すると既存の関数で出来てしまうのです。

◆サンプル

use strict;
use warnings;

my @data = ('AAA', 'BBB', 'CCC', 'BBB', 'DDD', 'AAA', 'DDD', 'EEE');

my @uniq = do { my %wk; grep { !$wk{$_}++ } @data };

local $, = ',';
print @uniq;

◆解説

  • do関数は、引数のブロックを実行して、最後に評価した式の値を返します。
  • grep関数は、引数の配列を検索して条件が真のときにその要素を返します。

今回、grep関数で配列を検索して、初回マッチでは『$wk{$_}++ 』は++する前なのでゼロで『偽』となり、それを『!』で否定しているので『真』となり、その値を返します。
つぎに、do関数では、最後に評価した式の値を返しますので、それをリストコンテキストで@uniqへ返します。
初回以外でマッチする(つまり同じ値の要素の)時は、すでに++で1になっているので『真』となり、それを『!』で否定しているので『偽』となり、その値をかえしません。


よって、結果的に@uniqはユニークな要素が格納されるわけです。

◆補足

『undefと''が同一視される問題あり。List::MoreUtils 0.25_02 のuniqでは対処』
(kitsさんより、教えて頂きました。いつも、ありがとうございます!)
(私の環境では、VERSION = '0.22'だったので、まだ、同一視しているようです…)