sedコマンドでテキストファイルから文字を抜き出す

HPとかから一覧データを取ってくる時に、一気に抜き出せるので便利なのでメモ。

a.htmlが下記のような感じだったとき
<html>
<body>
<ul>
<li><a href="a.html">■テキスト1</a></li>
<li><a href="b.html">■テキスト2</a></li>
<li><a href="c.html">■テキスト3</a></li>
<li><a href="d.html">■テキスト4</a></li>
</ul>
</body>
</html>

■テキスト1
■テキスト2
■テキスト3
■テキスト4
を抜き出す方法。

まずsedコマンド
sed -n '/■/p' a.html
これで
  <li><a href="a.html">■テキスト1</a></li>
<li><a href="b.html">■テキスト2</a></li>
<li><a href="c.html">■テキスト3</a></li>
<li><a href="d.html">■テキスト4</a></li>
だけが抽出出来るので、あとはエクセルとかに貼り付けて、区切り位置で分割すればOK。
そのあと、エクセルで好きな感じに連結すれば作業効率もアップ!

参考サイト
sedでこういう時はどう書く?
sed コマンド
スポンサーサイト

ディレクトリ名 + 元のファイル名にリネームするシェル

ディレクトリ名 + 元のファイル名にリネームするシェルのメモ。
ディレクトリ名 : abc
ファイル名 : 001.txt
リネームしたいファイルがあるディレクトリまで移動して
とかってあった時のシェル。
for file in *.png; { mv "$file" "xxx_$(basename `pwd`)_$file"; }
をする。
abc/001.txt

abc/xxx_abc_001.txt
にリネームされる。

cronでscpする方法

cronでscpするのに、かなり迷ったのでメモ。

ls -1 /var/www/html/log-`date '+%Y%m%d'`* | while read fname
do

expect -c "
set timeout 60
spawn scp -i /var/www/.ssh/id_rsa -P 9022 ${fname} sshuser@123.456.789.012:put_directry/
expect {
\" Are you sure you want to continue connecting (yes/no)? \" {
send \"yes\r\"
expect \"passphrase\"
send \"パスワード\r\"
} \"passphrase\" {
send \"パスワード\r\"
}
}
expect {
\"denied\" { exit 0 } \
\"100%\" { exit 1 }
}
"
done


expectで対話形式で自動的に処理が出来るが、
cronから実行するとinteract が使えなかったり

spawn scp -i /var/www/.ssh/id_rsa -P 9022 /var/www/html/log-`date '+%Y%m%d'`* sshuser@123.456.789.012:put_directry/

とアスタリスクでアップ出来なかったりと、色々と問題があった。

これで、一応OK!

参考サイト
o0 expectを利用し複数ファイルscpする 0o
expectコマンドで、scpを自動化するためのスクリプト
ssh-addとexpectによるパスフレーズ入力がcronでは機能しない

subversionの設定に参考にしたサイト

subversionの設定に参考にしたサイトをメモ。

ごった煮
気の向くままに・・・

サーバーの負荷を調べるコマンド

uptimeコマンドを使う
0:54PM up 12 days, 12:58, 1 user, load averages: 0.57, 0.42, 0.28
のように結果が返ってくる。

見方。
現在時刻 稼働時間 ログインユーザー数 ロードアベレージ
0:54PM up 12 days, 12:58 1 user load averages: 0.57, 0.42, 0.28
ロードアベレージは 左から「過去1分」、「過去5分」、「過去15分」のロードアベレージ。
CPUが一つのPCの場合ロードアベレージが1を超えるという状態はCPUがずっと使われっぱなしということで、他の処理をしようとすると時間がかかってきます。

プロフィール

U2K

Author:U2K
いろいろプログラムに関しての覚え書きをちょくちょくと書いていきます。

オススメ










オススメ

忍者AdMax

u2k on Twitter

最近の記事