A Day in the Life

2006-07-09

マルチバイトなテキストファイル群を grep りたい

エンコーディングがばらばらなテキストファイルからマルチバイト文字を grep かけて検索したいんだけどUTF-8(端末のエンコーディング)しかひっかかんねぇぇぇぇなんかいいツール知ってたら教えてください、Linux の CUI ので。全部のエンコーディング統一しろ、というのは無しで☆

いわせみてえなもんだ

略していわみて。だとずっと思っていたら違った!!てっきり秀作の名字は岩瀬だと思っていていわせみてえなもんだなんだよだとおもっていたよこんなまちがいセカイに俺一人フォーリンラヴ?

google:いわせてみてえもんだ

google:いわせみてえなもんだ

原稿で週末が終わった

今週有給とろう

タイプカウンタのアレ

現時点でのを出力。

perl typecount.pl /mnt/c/Documents\ and\ Settings/gorou/デスクトップ/typect/data

bs

10636

tab

2615

enter

18489

shift

12388

ctrl

10025

alt

4436

esc

215

space

10422

left

2390

up

5405

right

2058

down

7811

del

15

0

628

1

1220

2

1422

3

437

4

343

5

245

6

169

7

618

8

617

9

566

a

10110

b

1352

c

2873

d

6169

e

7322

f

1654

g

2354

h

4707

i

9084

j

10576

k

11156

l

5770

m

2882

n

7685

o

7967

p

3448

q

358

r

6383

s

6902

t

9296

u

6674

v

2225

w

3569

x

1456

y

2287

z

496

other

18355

http://subtech.g.hatena.ne.jp/miyagawa/20060708/1152343238

の出力を CVS じゃなくてはてな記法で。

for my $key (@print_keys) {
    print ":$key:$data{$key}\n"
}

dRuby 本

http://www2a.biglobe.ne.jp/~seki/ruby/druby.html

をー、一部草稿が公開されてるじゃんすか!

24サーチライト / NIRGILIS

kaze

あー。朝それっぽいなーと思ったけど病は気からなので忘れてgencho周りやってたのだけど、職場出て帰路でやっぱkaze だよなーと思っていまだるい。gencho はサンプルアプリに時間かかりすぎて21時ぐらいから内容書き出して今3割ぐらい。明日風邪で死にそうじゃなければたぶん終わる。それにしても n の人とかわりとすごいスピードで書けてすごい。俺は文章が下手すぎるから何回も何回も何回も文章の再構築をしていてでもちっともうまい文章にならないので面白い文を書ける人には尊敬と嫉妬します。id:hentai さんや id:aikawa8823 さんとか今頃どっかで何か書いてるんだろうか。

記事の一覧 >