1 頁 (共 1 頁)

香草輸入法0.06加入倉頡、簡易輸入法

發表於 : 08/23/2004 11:24 pm
lukhnos
香草輸入法0.06版發佈了。這一版除了在使用者介面上有很大的改進外,最大的新增功能,便是加入了倉頡及簡易輸入法。「香草」的倉頡和簡易使用和xcin一樣的第三代倉頡碼,先前在冰果室討論過的蘋果倉頡難用的情形,應該可以獲得改善。

關於0.06版的相關訊息、取得方法,可以連至這個網頁:http://osxchat.blogspot.com/2004/08/006.html

希望這個版本能為倉頡或簡易的使用者帶來更多的便利。:)

又,感謝mjhsieh轉來先前冰果室關於蘋果倉頡的諸多問題討論的文章,請見以下兩文章串:
http://ubb.frostyplace.com.tw/viewtopic ... 8949#38662
http://ubb.frostyplace.com.tw/viewtopic.php?t=2482

發表於 : 08/23/2004 11:42 pm
bryanchang
期待 TRU 試用結果.... :shock:

發表於 : 08/24/2004 2:41 am
janusng
非常多謝lukhnos君的無私貢獻! :D

剛剛試過倉頡和簡易,有幾點建議。
  • 欠缺標點符號。可否提供以前Mac OS X之前,","出「,」、"."出「。」等的直接輸入(OS X.3的標點符號是嚴重的難用!),並加上Windows的"zx"係列標點符號輸入辦法?
  • 欠缺HKSCS字。
  • 加上倉頡五代編碼。
  • 簡易的輸入法,只限於輸入二碼,並於第二碼後,自動列出選字列,而不用再按space鍵。
  • 所有未有對應的鍵,如數字等,出回原來的字或符號(不用再按space鍵)。最好可以在設定中,選擇英文字型(不是半型)或全型選擇。如無得選擇,應以英文字型輸出。
  • 可否如內建的輸入法般,可以提供「簡拼」的功能,即如打入"a"時,不用按space鍵,列出所有由「日」開頭的選字列;"ab"時,列出所有「日月」開頭的選字列,先列出只有打入的字碼(即如"a"時,先列出「日」;"ab"時,先列出「明」),之後以常用程度或個人使頻率編排。
    這個設計,可以解決重碼字要按space後,再選字的問題。
    如"dhe"[space]後,直出「皮」字,要輸入「板」字,只能於按入"dhe"後,再按"2"字從選字列中選出("1"為「皮」字;留意,不按space鍵)。尤其加入hkscs字後,重碼字非常普遍。
小弟再為每一點,在OpenFoundry的回報系統的bug tracking中加入。 :)

Btw,看到lukhnos君對於UTF-16的疑問,其實UTF-16是支援code point>16-bit的,它是用surrogates的,可以參考What are surrogates?。不支援code point>16-bit的,叫UCS-2,deprecated。

發表於 : 08/24/2004 4:39 am
the real unknown
bryanchang 寫:期待 TRU 試用結果.... :shock:
沒空!

發表於 : 08/25/2004 3:43 pm
lukhnos
janusng兄,先謝謝您的細心使用和feedback。有些功能的新增及修正,因為我並不是完全確定該怎麼做,想和大家一起討論看看。我想因為項目還蠻多的,因此還是利用冰裹室的討論區來張貼。詳細的版本更動和to-do list,我會在重整OpenFoundry上「香草」的計劃wiki page後,再行放置上去。以下:
  • 欠缺標點符號。可否提供以前Mac OS X之前,","出「,」、"."出「。」等的直接輸入(OS X.3的標點符號是嚴重的難用!),並加上Windows的"zx"係列標點符號輸入辦法?
香草的倉頡模組和注音共用同一套標點符號,亦即輸入 shift-, (<) 可以輸入全形逗點:shift-. (>) 可以輸入全形句點。因為我不是很瞭解大多數倉頡使用者的習慣。大家會希望按 "," 能出全形逗點,"." 能出全形句點嗎?或者說應該將之設為option?
  • 欠缺HKSCS字。
在Autrijus的大力提供新版Perl iconv下,cj.cin後段的HKSCS部份已經可以直接編入香草裡了。

現在的問題是,編入HKSCS後,難道不會造成現有蘋果倉頡的重覆字過多問題嗎?
或者還是應該要加入「搜尋香港字集」的選項呢?
  • 加上倉頡五代編碼。
嗯,這個問題大概是我最不知道該怎麼處理才好的了... 首先,是否有現成的碼表?
再來是,要如何merge進入第三代倉頡裡?
我最單純的想法是,如果有第五代碼表,便直接merge進入cj.cin裡,
然後剔除重碼字,亦即

cj_new.cin = cj.cin + cj_5_table - duplicated_code

可是這樣不知會不會造成新的問題。例如,會不會因此仍造成重碼字增加等等。
  • 簡易的輸入法,只限於輸入二碼,並於第二碼後,自動列出選字列,而不用再按space鍵。
嗯,確實應該這樣做。這個問題一定會在下一版的香草處理掉。
  • 所有未有對應的鍵,如數字等,出回原來的字或符號(不用再按space鍵)。最好可以在設定中,選擇英文字型(不是半型)或全型選擇。如無得選擇,應以英文字型輸出。
  • 可否如內建的輸入法般,可以提供「簡拼」的功能,即如打入"a"時,不用按space鍵,列出所有由「日」開頭的選字列;"ab"時,列出所有「日月」開頭的選字列,先列出只有打入的字碼(即如"a"時,先列出「日」;"ab"時,先列出「明」),之後以常用程度或個人使頻率編排。
    這個設計,可以解決重碼字要按space後,再選字的問題。
    如"dhe"[space]後,直出「皮」字,要輸入「板」字,只能於按入"dhe"後,再按"2"字從選字列中選出("1"為「皮」字;留意,不按space鍵)。尤其加入hkscs字後,重碼字非常普遍。
這兩點是我比較不明白的地方。

先講第一點,您的意思是否是,不管有沒有在選字模式裡,只要是按了a-z範圍(或是選字模式時的1, 2, 3等)以外的鍵,就應該立即組出現有的字(如果是合法的字碼)並選出首字,然後將剛剛的鍵直接輸出;至於輸出的字碼為半形或全形,應由使用者設定?

「簡拼」的功能,我想您指的應該是蘋果倉頡裡的「動態提示」。如果我們打開了動態提示,那麼輸入了DHE之後會出現「皮」和「板」兩個後選字。那這應該怎麼處理?是否就是使用者如果此時按下space,就不再進入後選字模式,直接出第一個「皮」字?
Btw,看到lukhnos君對於UTF-16的疑問,其實UTF-16是支援code point>16-bit的,它是用surrogates的,可以參考What are surrogates?。不支援code point>16-bit的,叫UCS-2,deprecated。
謝謝janusng兄的指點,原來UTF-16可以含括超過0x10000範圍的字碼。這樣子就不用擔心HKSCS的問題了。也再次謝謝您的feedback!

發表於 : 08/25/2004 5:16 pm
janusng
lukhnos 寫:香草的倉頡模組和注音共用同一套標點符號,亦即輸入 shift-, (<) 可以輸入全形逗點:shift-. (>) 可以輸入全形句點。因為我不是很瞭解大多數倉頡使用者的習慣。大家會希望按 "," 能出全形逗點,"." 能出全形句點嗎?或者說應該將之設為option?
一直以來,在Mac上,倉頡和簡易中,也是按「,」直出「,」、「;」直出「;」、「.」直出「。」的,不用選,不用按space bar。直到OS X後,改了幾次,無一個比得上OS 9時的好用。但基本上都是按符號時出,合符中文的全形符號。除了按「`」時,會列出其他未有的對應的符號,如「、」「.」「.」等以供選擇。你可以參考OS 9或OS X上的倉頡輸入法。

如果可以的話,還請加入Windows上,用「zxad」輸出「。」、「zxac」輸出「,」等的設定。
lukhnos 寫:在Autrijus的大力提供新版Perl iconv下,cj.cin後段的HKSCS部份已經可以直接編入香草裡了。

現在的問題是,編入HKSCS後,難道不會造成現有蘋果倉頡的重覆字過多問題嗎?
或者還是應該要加入「搜尋香港字集」的選項呢?
解決重碼字(不單只HKSCS)的辦法,請參看以下答案。
lukhnos 寫:嗯,這個問題大概是我最不知道該怎麼處理才好的了... 首先,是否有現成的碼表?
朱邦復的個人網站,有最新的五代倉頡下載。
http://www.cbflabs.com/tec/cbflabs/cjwo ... tm?type=10
lukhnos 寫:再來是,要如何merge進入第三代倉頡裡?
我最單純的想法是,如果有第五代碼表,便直接merge進入cj.cin裡,
然後剔除重碼字,亦即

cj_new.cin = cj.cin + cj_5_table - duplicated_code

可是這樣不知會不會造成新的問題。例如,會不會因此仍造成重碼字增加等等。
千萬不要。
倉頡五代和三代,應該各自獨立成為兩個輸入法。同樣地,簡易五代和三代,也應該各自成為另外兩個輸入法。

如不怕煩,還有一個建基於倉頡的快倉,可以加入。
http://www.scj2000.com/downloads.html
lukhnos 寫:這兩點是我比較不明白的地方。

先講第一點,您的意思是否是,不管有沒有在選字模式裡,只要是按了a-z範圍(或是選字模式時的1, 2, 3等)以外的鍵,就應該立即組出現有的字(如果是合法的字碼)並選出首字,然後將剛剛的鍵直接輸出;至於輸出的字碼為半形或全形,應由使用者設定?
例如倉頡是只有使用25個字母作為字根(加上Windows上的"zx"的話,全26個字母也用上),但數字如"1"、"2"、"3"等,也是沒有用上。可否設定所有不使用的字符,也直接輸出英文字(不是半形字)?

這個設計,對拼音或倉頡等使用字母輸入的輸入法,幫助不大;但當你加入以數字為編碼的輸入法,如四角號碼和九方等,便大有分別!因為它們不使用字母,如果打「a」出「a」,打「B」出「B」,它們的使用者,除了要輸入羅馬數字時,其他時間,是完全不用轉中英文的,非常方便。

如果可以的話,也可以加設輸出全形字的option。但default應是半形字,比較有用。
lukhnos 寫:「簡拼」的功能,我想您指的應該是蘋果倉頡裡的「動態提示」。如果我們打開了動態提示,那麼輸入了DHE之後會出現「皮」和「板」兩個後選字。那這應該怎麼處理?是否就是使用者如果此時按下space,就不再進入後選字模式,直接出第一個「皮」字?
我的意思是,例如,倉頡中打入「dhe」,開了簡拼後,會列出「皮」、「板」、「格」、「柊」、「桻」和「栙」。

當中「皮」字和「板」兩字的編碼,也是「dhe」,自然應該優先列出,加上「皮」字比「板」常用,排在頭。

之後的「格」、「柊」、「桻」和「栙」,也是以「dhe」開頭的,「格」字「dher」、「柊」字「dhey」、「桻」字「dhejq」、「栙」字「dheq」。以常用頻率編排,是「格」、「柊」、「桻」和「栙」,所以打入「dhe」時,應該依序列出:「1皮 2板 3格 4柊 5桻 6栙」。

當使用者打入「dhe」,按[space]後,應該輸出第一候選字,「皮」字,而不用使用者再從「皮」字和「板」字之中選擇。要輸出「板」字,便只能夠以打入「dhe2」來輸出。兩者要打入的鍵數,包括[space],也只是四鍵,並無增加。

這個辦法,只要重碼字不多於九個,對使用者不會增加按鍵數目。

對於原本非重碼字,加入HKSCS字後,成為重碼字的問題,因為不影響原本無重碼字的打法,所以無影響。不會因為加入HKSCS,而構成不便。

如果你喜歡,也可以用options選擇是否要「簡拼」或「按space直接輸出優先字」。但我建議default應兩者也是default enabled。

發表於 : 08/25/2004 9:23 pm
the real unknown
我沒有用這個輸入法。不過有兩個忠告:

1. 自己不用的輸入法,就不要浪費自己和大家的時間了。蘋果自己的輸入法就是這樣搞爛的。
2. 硬要把多個輸入法塞進一個輸入程式裡,也可以省省了。

發表於 : 08/25/2004 10:32 pm
janusng
the real unknown 寫:我沒有用這個輸入法。不過有兩個忠告:

1. 自己不用的輸入法,就不要浪費自己和大家的時間了。蘋果自己的輸入法就是這樣搞爛的。
2. 硬要把多個輸入法塞進一個輸入程式裡,也可以省省了。
有道理,所以lukhnos君才需要feedback吧。 :)

可否只顯示big5字集?

發表於 : 11/17/2004 12:18 pm
pankeron
請問一下,我已下載並安裝了香草輸入法,但好像沒什麼變,仍跟之前的輸入法一樣,是不是要去哪裡做「啟用」之類的動作呢?

另外,10.3的倉頡有個很討人厭的一點,就是多了很多不是繁體中文的字,像是大陸的簡體字或者一些原本中文字的另一種寫法。導致很多本來不需要選字的字,到了10.3的倉頡變成要選字了。然後本來輸入完如果要選字,但你不理它繼續打下一個字,會自動選取第一個字。

但在有些軟體會因此而當掉,於是我打字便得異常地小心,一看到有選字框跳出來時就要等別注意,常常打得太順手然後軟體就當了....可否讓輸入法只出現big5的字不要出現一堆簡體字呢?

Re: 可否只顯示big5字集?

發表於 : 12/20/2004 10:26 am
lukhnos
pankeron 寫:請問一下,我已下載並安裝了香草輸入法,但好像沒什麼變,仍跟之前的輸入法一樣,是不是要去哪裡做「啟用」之類的動作呢?
您的確是必須去「啟用」它。從輸入法選單拉下來的「偏好設定」,或是從螢幕左上角蘋果選單 -> 系統偏好設定 -> 國際設定 -> 輸入法,然後把「香草輸入法 0.064」給勾選起來,輸入法就會出現在選單上了。

如果您裝的是 OpenVanilla 0.6.1,步驟也是一樣的。這個問題出在 Mac OS X 並沒有提供一套方法,可以讓輸入法在安裝完畢之後,自動加進使用者的輸入法選單裡。

發表於 : 12/20/2004 11:44 am
lukhnos
一段時間過去,OpenVanilla 0.6.1 發表,回 janusng 兄的信,也等於對這些功能建議,做一個 review.
janusng 寫:
  • 欠缺標點符號。可否提供以前Mac OS X之前,","出「,」、"."出「。」等的直接輸入(OS X.3的標點符號是嚴重的難用!),並加上Windows的"zx"係列標點符號輸入辦法?
  • 欠缺HKSCS字。
  • 加上倉頡五代編碼。
  • 簡易的輸入法,只限於輸入二碼,並於第二碼後,自動列出選字列,而不用再按space鍵。
  • 所有未有對應的鍵,如數字等,出回原來的字或符號(不用再按space鍵)。最好可以在設定中,選擇英文字型(不是半型)或全型選擇。如無得選擇,應以英文字型輸出。
  • 可否如內建的輸入法般,可以提供「簡拼」的功能 [範例略]
首先先提標點符號的問題,這一直是我還沒能好好處理的地方。目前 OpenVanilla 0.6.1 裡面,「香草倉頡」還是跟原來香草輸入法一樣,是按 < 出全形逗點、 > 出全形句點,而 , . 都是半形。至於「Xcin 倉頡」則由 b6s (本身是倉頡使用者)增加了標點符號的定義,同樣保留 , . 的半形輸出。

目前的話,透過修改「Xcin 倉頡」的 cj.cin 方式,確實可以做到修改標點設定,以配合任何需要的程度。再加上 OV 0.6.1 加入了全形∕半形的輸出選項,就技術上來說,提供各種標點輸入的選擇是有可能的。

既然 OV 0.6.1 有了使用者偏好設定的功能,我覺得一個比較好的方法,是提供幾種主流的標點符號輸入方式,例如 Mac OS 9, Xcin, 倚天中文。但是這些都需要使用者提供完整的規格才行。只是用舉例的方式是不夠的,這一點恐怕還是要由有需求的人來下工夫才行。

HKSCS 部份,OV 0.6.1 的「Xcin 倉頡」終於納入了完整的 cj.cin ,同時改用 UTF-8 做為內部編碼,完整支援 cj.cin 裡面的 HKSCS 字。

倉頡五代編碼,或是「快倉」的話,只要能轉成 UTF-8 編碼的 .cin 格式,將檔案用 sudo 拷貝至 /Library/OpenVanilla/(版本號)/OVIMxcin/ 這個目錄裡,就可以出現該輸入法了。這一部份,也是端看有需要且會修改的朋友,有沒有可能編出合用的 .cin 檔,供大家使用了。

當然,gugod (OV 作者之一)和我也曾討論過,目前這種要使用者去改 .cin 的方式,並不是非常 Mac,離 "it just works" 的距離還很遙遠。也有人提議寫一套 Cocoa 的 .cin editor/wizard/generator ,讓大家可以輕鬆改出自己所需的輸入法。這些當然也是值得努力的方向。

簡易的問題自香草輸入法 0.062 之後就解決了,這個簡易模組仍在 OV 當中延用。標點符號出全形半形的問題如上所述。我想也許在下一個 patch version 中,就可以先行把香草倉頡的全形標點給拿掉了(或者以增加選項的方式來做)。

簡拼的功能,目前 OV 的 Xcin 倉頡,實作了 Xcin 的 "auto compose" 功能,也就是邊打邊組字。限於資料結構,組字只組目前已打出的倉頡字根,而非字根為首的所有可能字。例如 "dhe" 再按空格會出「皮」,"dhe2" 就出「板」了。這樣應該是部份實現了先前所提的需求了。

    發表於 : 12/20/2004 1:12 pm
    janusng
    lukhnos 寫:簡拼的功能,目前 OV 的 Xcin 倉頡,實作了 Xcin 的 "auto compose" 功能,也就是邊打邊組字。限於資料結構,組字只組目前已打出的倉頡字根,而非字根為首的所有可能字。例如 "dhe" 再按空格會出「皮」,"dhe2" 就出「板」了。這樣應該是部份實現了先前所提的需求了。
    多謝 lukhnos 君的回覆!

    先回應簡拼功能和 HKSCS,其他有關小弟的建議,待小弟整理完 xcin 再回覆。

    lukhnos 君所改良的簡拼,正是小弟所想的做法。唯一不同的是,小弟心中的“選字列”是在打入了第一個鍵之後便出現,如同按標點符號時一樣;而不是按完鍵後,還要再按 [space] 才出現。這樣才能夠知道按下 "dhe" 時,再按 [space] 是「皮」,按 "2" 是「板」,而且「皮」和「板」也只是四鍵(“dhe[space]”和“dhe2”)。現時 Openvanilla 0.6.1 中,「板」字是並沒有改善,還是五鍵(“dhe[space]2”)。如果能夠不用按 [space],便在選字列中,顯示以“dhe”開始的字的話,便更完美了!

    出奇地,[space]上第一個選擇的設定,是不適用於標點符號上,如“+[space]”是不能夠打出「+」號,必須要打“+1”才行。

    另外,小弟還是有點兒不明白,如何可以打入 HKSCS。小弟試過打入“rmy[space]”,但不能夠出現「

    發表於 : 12/20/2004 4:58 pm
    lukhnos
    janusng 寫:的簡拼,正是小弟所想的做法。唯一不同的是,小弟心中的“選字列”是在打入了第一個鍵之後便出現,如同按標點符號時一樣;而不是按完鍵後,還要再按 [space] 才出現。這樣才能夠知道按下 "dhe" 時,再按 [space] 是「皮」,按 "2" 是「板」,而且「皮」和「板」也只是四鍵(“dhe[space]”和“dhe2”)。現時 Openvanilla 0.6.1 中,「板」字是並沒有改善,還是五鍵(“dhe[space]2”)。如果能夠不用按 [space],便在選字列中,顯示以“dhe”開始的字的話,便更完美了!
    不好意思,janusng 兄可能沒注意到,在你拉下 OpenVanilla 0.6.1 的輸入法選單時,有兩個倉頡輸入法:「OpenVanilla 倉頡」和「OpenVanilla Xcin (倉頡)」,請選用後者,才有標點符號的改善、簡拼,以及 HKSCS 字支援。之所以還留著「舊」香草倉頡,是考慮到可能已經有很多使用者在用了,想等大家對 Xcin 倉頡的 review 到一階段,再將前者給phase out 掉。

    發表於 : 12/20/2004 7:13 pm
    lukhnos
    janusng 寫:lukhnos 君所改良的簡拼,正是小弟所想的做法。唯一不同的是,小弟心中的“選字列”是在打入了第一個鍵之後便出現,如同按標點符號時一樣;而不是按完鍵後,還要再按 [space] 才出現。這樣才能夠知道按下 "dhe" 時,再按 [space] 是「皮」,按 "2" 是「板」,而且「皮」和「板」也只是四鍵(“dhe[space]”和“dhe2”)。現時 Openvanilla 0.6.1 中,「板」字是並沒有改善,還是五鍵(“dhe[space]2”)。如果能夠不用按 [space],便在選字列中,顯示以“dhe”開始的字的話,便更完美了!
    Ouch, 不好意思,簡拼的問題,我突然想到,0.6.1 版的「Xcin模組」有個 bug,所以 auto compose 並沒有正常運作。這個 bug 將會在最近的 0.6.2 update 中補正。

    至於 HKSCS 字的問題,選用Xcin倉頡就可以解決了。

    不好意思,因為自己已經在用更新版,忘了其實 0.6.1 有這個 bug :Q

    發表於 : 01/07/2005 11:44 pm
    nameless1980
    我是簡易輸入法的使用者,在Openvanilla中有相關詞庫的功能嗎??

    發表於 : 01/07/2005 11:55 pm
    lukhnos
    nameless1980 寫:我是簡易輸入法的使用者,在Openvanilla中有相關詞庫的功能嗎??
    目前 OV 的簡易模組(從香草過來的傳統簡易)是沒有相關字詞功能的。

    發表於 : 03/15/2008 2:07 am
    nameless1980
    有了....出了相關詞彙的alpha版..^_^ 萬歲..只差翻頁功能...加油...

    http://osxchat.blogspot.com/2007/11/ope ... alpha.html