各位前輩大家好,
最近工作上接了一個新的case,是個有歷史的網站主機更換升級及維護工作。原本是RH3 P3主機更換了新的Server 與安裝CentOS5.2 資料庫轉換沒遇到什麼障礙,就依據各大網路搜尋到Mysql 升級程序與注意步驟,花了十多小時,成功的把2005年運作至今的latin1 升級成UTF8。
現在我比較傷腦筋的在於網站程式碼的轉檔方式了。由於眾多語系,因此得一個一個先判斷語系厚,在依照原始語系轉換成UTF8。程式搜尋一下含附件有八千多個檔案。
1.先以convmv 把檔案名稱修正為UTF8
convmv -f big5-eten -t utf8 --notest --nosmart 檔案路徑&名稱 -r
2.先用enca工具判斷檔案語系
enca -L zh_TW /var/www/html/index.htm
得結果
Traditional Chinese Industrial Standard; Big5
Mixed line terminators
3.在用piconv 轉換成utf8格式
piconv -f big5 -t utf8 來源檔案名稱 > 目的檔案名稱
這樣的程序,有無方式可以寫成批次來同時大量執行呢??