2015-10-28

安裝 opencc for python

溫馨提示:本篇為 opencc 0.4.3 安裝教學,若你要安裝新版的 opencc 1.0.4請到這裡  

如果你只要安裝 opencc 指令工具那你只要
MAC
# brew install opencc
CENTOS
# yum install opencc

但若你 是要 opencc 給 python 執行,那你只能:
1. 目前 python 的 OpenCC 0.1 是基於 opencc 0.4.3 開發的,故首先你要先安裝 opencc 0.4.3 (安裝新版的會有 symbol 出錯, 因為有的 function 在新版被移除了)
opencc 0.4.3下載點 https://bintray.com/byvoid/opencc/OpenCC/0.4.3/view

2. centos 很好裝, 照這裡(http://byvoid.github.io/OpenCC/0.4.3/index.html)安裝即可
若遇到 libopencc.so.2: cannot open shared object file: No such file or directory
那是因為build 出來的 library 是 32bit, centos 64bit 是放在 /usr/lib64/ 故建個捷徑連到 /usr/lib 即可
#sudo ln -s /usr/lib/libopencc.so.2 /usr/lib64/libopencc.so.2

3. mac 需要點小技巧, 就是把 gettext 設為 off, 副作用即錯誤訊息用原文(english)顯示(這並沒什麼)。 Architecture 設為 x86_64。
首先確認你有沒有 cmake , 若無  
# brew install cmake
再來就是到 opencc 的目錄執行 
# mkdir build
# cd build 
# cmake -DCMAKE_INSTALL_PREFIX=/usr/local -DCMAKE_BUILD_TYPE=Release -D ENABLE_GETTEXT:BOOL=OFF  -DCMAKE_OSX_ARCHITECTURES=x86_64 ..
# make
# sudo make install

4. 最後,用 pip 安裝 OpenCC 即可
# pip install opencc

Collecting opencc
  Using cached OpenCC-0.1.tar.gz
Installing collected packages: opencc
  Running setup.py install for opencc
Successfully installed opencc-0.1

===  測試   ===
$ python manage.py shell
======== running in local mode ========
Python 3.4.2 (default, Nov 20 2014, 13:21:53)
[GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.54)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
(InteractiveConsole)
>>> import opencc
>>> opencc.convert('滑鼠', config='zhtw2zhcn_s.ini')
'鼠标'
>>> opencc.convert('滑鼠裡面的矽二極體壞了,導致游標解析度降低。', config='zhtw2zhcn_s.ini')
'鼠标里面的硅二极管坏了,导致光标分辨率降低。'
>>>

[0.4.3 內建的配置文件說明,供參考]
mix2zhs.ini    >>    簡繁混合轉簡
mix2zht.ini    >>    簡繁混合轉繁
zhs2zht.ini    >>    簡轉繁
zhs2zhtw_p.ini    >>    簡轉台灣正體並使用台灣用詞
zhs2zhtw_v.ini    >>    簡轉台灣正體
zhs2zhtw_vp.ini    >>    from Simplified to variants and phrases of Taiwan
zht2zhs.ini    >>    繁轉簡
zht2zhtw_p.ini    >>    繁轉台灣正體並使用台灣用詞
zht2zhtw_v.ini    >>    繁轉台灣正體
zht2zhtw_vp.ini    >>    繁轉台灣正體修正差異並使用台灣用詞
zhtw2zhcn_s.ini    >>    台灣正體轉大陸用詞,使用簡體
zhtw2zhcn_t.ini    >>    台灣正體轉大陸用詞,使用繁體
zhtw2zhs.ini    >>    台灣正體轉簡體
zhtw2zht.ini    >>    台灣正體轉繁體

p表示phrases,v表示variants,s表示simplified,t表示traditional。

1 則留言:

  1. 請問,opencc 0.4.3這個檔案應該要放到哪個路徑底下?
    後面的cmake -DCMAKE_INSTALL_PREFIX=/usr/local -DCMAKE_BUILD_TYPE=Release -D ENABLE_GETTEXT:BOOL=OFF -DCMAKE_OSX_ARCHITECTURES=x86_64 ..步驟會出現error:
    CMake Error: The source directory "*" does not appear to contain CMakeLists.txt.
    謝謝

    回覆刪除