在找BOSS聊了之後,終於放棄了文檔指導灰常少的CMU SPHINX,開始研究HTK工具包,進行一系列的語音相關的工作。最近這幾天一直都在看HTKBOOK,今天准備一邊進行windows下安裝和編譯HTK庫,一邊把這其中的過程記錄下來,跟大家一起分享。
HTK是用來進行自動語音識別研究的工具包,它由劍橋大學工程系的機器智能實驗室開發的開源軟件,全稱叫做Hidden Markov Toolkit。官方網站:http://htk.eng.cam.ac.uk
下面讓我們開始吧!
第一步:下載官方源代碼:http://htk.eng.cam.ac.uk/download.shtml
這裡可能需要注冊,比較麻煩,也可以去網上搜索,已經有人從官網上下載好了。不過,要注意下載的是windows下,linux的也有,以後linux下的安裝我也會寫。下載之後,會有兩個包:HTK Source code以及HTK sampls。我下載的版本是3.4.1。
第二步:解壓文件,我在D盤中建立了一個文件夾HTK。將這兩個包解壓到裡面。打開htk包裡面有個README,裡面有一些在windows下安裝的要求:
* HTK has been verified to compile using Microsoft Visual Studio.
* For testing, you will require a Perl interpreter such as
ActivePerl.
* You will need a tool such as 7-zip or winzip (commercial) for unpacking
the HTK source code archive.
* It is helpful if you have some familiarity with using the DOS
command line interface, as you will need to interact with it in
order to compile, install and run HTK.
* Ensure that your PATH contains
C:\Program Files\Microsoft Visual Studio .NET 2003\Vc7\bin
Or if you are using older versions:
C:\Program Files\Microsoft Visual Studio\VC98\bin
進行一些准備工作ing.....LOADING...........
第三步:開始編譯
1.打開CMD
2.進入到htk文件夾
3.創建一個文件夾bin.win32,這個文件夾用來存放各種.exe文件。
4.運行VCVARS32
4.1首先設置環境變量:
4.2輸入VCVARS32