Hán Nôm - Software :  Diễn Đàn Viện Việt Học
Diễn đàn thảo luận về các nhu liệu Hán Nôm của Viện Việt Học và thân hữu thực hiện. 
Goto Thread: PreviousNext
Goto: Forum ListMessage ListNew TopicSearch
Goto Page: Previous123Next
Current Page: 2 of 3
Re: Han Nom and the Unihan Database
Posted by: Hoai Huong (---.res.east.verizon.net)
Date: April 05, 2005 07:49PM
>... tuy không phải viết như vậỵ..

Ý HH muốn nói là chữ Nôm không phải viết giống vậy, mà ông HTC ghi chữ lưu 留.
Ở đây thì dùng chữ lưu này . Cả hai đều có thể đọc là "trơu" cả .

HH

Re: Han Nom and the Unihan Database
Posted by: Hoc Ngo (---.dsl.snfc21.pacbell.net)
Date: April 05, 2005 10:12PM
Tôi thắc mắc là chữ Quốc ngữ hiện đại làm gì có âm ơu? Tại sao không dùng một âm hiện đại tương đương? Thú thật tôi không biết âm ơu phát âm ra sao?

Học


Re: Han Nom and the Unihan Database
Posted by: Hoai Huong (---.res.east.verizon.net)
Date: April 06, 2005 01:41AM
Anh Học Ngô,

Thắc mắc của anh không phải là không có lý. Đây là một chữ rất hiếm, HH cũng chưa bao giờ nghe qua , thấy anh nêu ra thì tra Td mới thấy thôi .

Quyển DNQATV xuất bản vào năm 1875. Theo HH được biết thì quyển Td hiện đại nhất còn ghi lại chữ này là Td Việt - Hoa - Pháp của Gustave Hue (1937).

Trơu: avaler avec une gorgée d'eau .

Thấy cái vần cũng lạ thiệt, nhưng mà nó có mặt trong ít nhất 2 quyển Td rồi, thì phải chấp nhận thôi . :-)

Cám ơn anh đã đọc rất kỹ và nêu vấn đề.

HH

TB. Thì đọc là ơ u ơu trờ ơu trơu . :-)

Re: Han Nom and the Unihan Database
Posted by: Khúc Thần (---.fbx.proxad.net)
Date: April 06, 2005 02:33AM
Về vần "ơu" thì ta cũng có "nớu răng" (=lợi rặng). Có người nghĩ rằng đó cũng là "nướu".

Từ điển vần của Hoàng Phê (nxb. Đà Nẵng-TT Từ điển học, 1996) cũng khg có vần "ơu".

Kính

Khúc Thần

Re: Han Nom and the Unihan Database
Posted by: AnhMỹ Trần (---.247.49.143.Dial1.Stamford1.Level3.net)
Date: April 06, 2005 04:51AM
Tôi học vỡ lòng không có vần ơu, nhưng bây giờ thấy thì vẫn đọc được .
Thật lạ ! Có lẽ còn có nhiều vần không có nữa mà vẫn đọc được chăng ?
Âu là đọc ngắn, còn Ơu là đọc dài hơn của cùng một nguyên âm đầu trong nguyên âm kép này.

Re: Han Nom and the Unihan Database
Posted by: nnt (---.w82-121.abo.wanadoo.fr)
Date: April 06, 2005 11:24AM
Hoc Ngo wrote:

> So if you know
> the correct Vietnamese word, please reply to this message and
> send the correction to the Unicode Consortium or some authority
> in Vietnam who has working relationship with the Consortium.

Actually, I have no relations with the Unicode Consortium ...

For my part, I also think there are typos in some KVietnamese fields, but mostly where two pronounciations are given . Most of the first of the two Vietnamese pronounciations given for the following characters seem to be typos :

giả khúc
xâu canh
hốc đông
cũi sập
đàn cam
niêu lật
đắng hiệu
duyên án
điềm côn
nhắm đống
suông sàn
tóm lang
kéo cốc
xách bàng
đẽo giầm
day lẫm
quạt muồng
hàn gác
đan lan
cắn hâm
phơi tử
trưa ương
đêm tàn
nôi xác
dằm mỗi
choác cầu
héo thuỷ
đập tách
khung sươn
vè thảy
cụm ngập
mớ một
khem trong
vành sa
săng đờ
nhãn nề
thớt lệ
thợ cát
suyền hồng
chòng chao
sờ xối
rang rị
sượng đén
thổi vực
ngan vây
sói mủ
khú nhão
dề bành
váng khích
lậu thấp
nhắm làn
ngơ rợi
tròn sôi
đoái đùn
đòng bính
đào ùn
mũi rim
díp liệu
chùa lô
teo tường
rậm màu
lừa lang
rô vượn
đong ngục
tép sư
ngan đồi
dẽ điếm
yến nhẹ
cười mồi
rơm dao
rế li
sừng quỳnh
dậu sứ
bả cam
chuỗi súc
đứt tất
dẻo phen
nốt ngấn
còm lao
quặm hủi
vầu bách
đậu cau
phơ bồn
xồm manh
trầu khan
vờ khoé
cua nhản
cò gườm
thằn manh
kẻ lờ
ngao thỉ
khăn nghiên
khâm chỉm
đãy bìm
bâu pháo
khư ngạnh
khố nghiền
yếm nham
cời bích
vải tha
co lân
trối phèn
đình thị
dừng vũ
dịp tô
hớt lúa
đồn chòm
dấm sênh
nồng đệ
bú giăm
gắt lờ
à miến
nhạu thắt
lăm gút
nếm len
nhè tói
ầm liệng
khịt bừa
giõng giấc
tiếng nây
óng béo
ạc nẩy
nghêu rạ
sún rì
vay khúm
đặt nấm
hăm trun
thèm tho
dối nóc
ướm kiệu
nhăn dơi
gò nhện
chĩnh mòng
ven tã
ghen xộc
trêu đón
áy đưa
ngoắt nhíp
nhặt chìa
bắn nỉa
giơ khoá
cất xiềng
lấp beng
dí kiềng
nhúm cào
nhẹ cà
trét keng
bịt vàng
banh rìu
xoá lao
khuân thau
gánh cứa
lỏng vành
sểnh chặt
thoa khoan
đong móc
dong ngóng
vày lâu
quẳng chạo
nặn lươn

What do you think about it ?

Re: Han Nom and the Unihan Database
Posted by: nnt (---.w82-121.abo.wanadoo.fr)
Date: April 06, 2005 11:26AM
The same list with the codes without U+ :
66F2 giả khúc
66F4 xâu canh
6771 hốc đông
67C6 cũi sập
67D1 đàn cam
6817 niêu lật
6821 đắng hiệu
6848 duyên án
68CD điềm côn
68DF nhắm đống
68E7 suông sàn
6994 tóm lang
6996 kéo cốc
699C xách bàng
6A33 đẽo giầm
6A81 day lẫm
6AAC quạt muồng
6ACA hàn gác
6B04 đan lan
6B46 cắn hâm
6B7B phơi tử
6B83 trưa ương
6B98 đêm tàn
6BBC nôi xác
6BCF dằm mỗi
6BEC choác cầu
6C34 héo thuỷ
6C50 đập tách
6C55 khung sươn
6C70 vè thảy
6C72 cụm ngập
6C92 mớ một
6C96 khem trong
6C99 vành sa
6CB1 săng đờ
6CE5 nhãn nề
6CEA thớt lệ
6D01 thợ cát
6D2A suyền hồng
6D32 chòng chao
6D37 sờ xối
6D96 rang rị
6DDF sượng đén
6DE2 thổi vực
6E2D ngan vây
6E48 sói mủ
6F86 khú nhão
6F8E dề bành
6FC0 váng khích
6FD5 lậu thấp
703E nhắm làn
7051 ngơ rợi
708A tròn sôi
7096 đoái đùn
70B3 đòng bính
7185 đào ùn
7191 mũi rim
71CE díp liệu
7210 chùa lô
7246 teo tường
725F rậm màu
72FC lừa lang
733F rô vượn
7344 đong ngục
7345 tép sư
73B3 ngan đồi
73B7 dẽ điếm
73E5 yến nhẹ
7441 cười mồi
7464 rơm dao
7483 rế li
74CA sừng quỳnh
74F7 dậu sứ
7518 bả cam
755C chuỗi súc
7562 đứt tất
756A dẻo phen
75D5 nốt ngấn
7646 còm lao
7650 quặm hủi
767E vầu bách
768B đậu cau
76C6 phơ bồn
76F2 xồm manh
770B trầu khan
772D vờ khoé
773C cua nhản
7752 cò gườm
7791 thằn manh
77D1 kẻ lờ
77E2 ngao thỉ
7814 khăn nghiên
7827 khâm chỉm
782D đãy bìm
7832 bâu pháo
786C khư ngạnh
786F khố nghiền
789E yếm nham
78A7 cời bích
78CB vải tha
78F7 co lân
792C trối phèn
793A đình thị
79B9 dừng vũ
79DF dịp tô
7A6D hớt lúa
7B18 đồn chòm
7B19 dấm sênh
7B2C nồng đệ
7BB4 bú giăm
7C5A gắt lờ
7CC6 à miến
7D29 nhạu thắt
7E0E lăm gút
7E3A nếm len
7E53 nhè tói
7FCE ầm liệng
8019 khịt bừa
8040 giõng giấc
80D2 tiếng nây
813F óng béo
827F ạc nẩy
82F2 nghêu rạ
8351 sún rì
83B0 vay khúm
83CD đặt nấm
83D5 hăm trun
8429 thèm tho
84D0 dối nóc
854E ướm kiệu
86E6 nhăn dơi
8752 gò nhện
8813 chĩnh mòng
888F ven tã
8E85 ghen xộc
8FCD trêu đón
8FFB áy đưa
91DF ngoắt nhíp
9219 nhặt chìa
922E bắn nỉa
9299 giơ khoá
92E5 cất xiềng
92F2 lấp beng
9344 dí kiềng
93AC nhúm cào
93B6 nhẹ cà
93D7 trét keng
9404 bịt vàng
9410 banh rìu
9412 xoá lao
9430 khuân thau
943B gánh cứa
9445 lỏng vành
9455 sểnh chặt
9467 thoa khoan
9702 đong móc
9852 dong ngóng
9AC5 vày lâu
9B89 quẳng chạo
9C31 nặn lươn

Re: Han Nom and the Unihan Database
Posted by: Hoc Ngo (216.52.22.---)
Date: April 06, 2005 01:03PM
Tôi dùng unihan.txt phát hành cùng với chuẩn Unicode 4.1 để lọc ra các chữ Nôm cho WinVNKey 5. Khả năng của tôi chỉ là dò cột chữ Quốc ngữ để xem lỗi chính tả mà thôi, chứ tôi không biết chữ Hán hoặc Nôm gì cả. Nhưng điều làm tôi ngạc nhiên nhất là cột chữ Quốc ngữ có rất nhiều từ, tuy phát âm được, nhưng hoàn toàn xa lạ không hề có trong nhiều tự điển Việt Nam hoặc Hán Việt mà tôi hiện có. Tôi đâm ra nghi ngờ sự chính xác của bảng chữ Nôm. Nhưng vì không phải là chuyên môn của tôi, tôi đành bấm bụng mà hỗ trợ tất cả trong WinVNKey 5.

Tôi ước mong quí vị chuyên về Hán Nôm hãy góp phần hiệu đính tất cả sai lầm. Cách đây độ 15 năm tôi có làm việc chung với Unicode để góp phần mã hóa chữ Quốc ngữ trong Unicode. Khi việc làm hoàn tất, tôi rút lui. Sau đó một thời gian thì Việt Nam có cử đại diện làm việc chung với Unicode để mã hóa chữ Nôm. Do đó, mọi sự hiệu đính có lẽ phải thông qua đại diện này.

Trong khi chờ đợi, có lẽ chúng ta nên post danh sách chính thức các chữ Hán Việt, Nôm Việt công khai trên Internet để cho mọi người góp ý. Có như thế, chúng ta mới mong có một bảng chữ chính xác, thống nhất, và tồn tại lâu dài.

Học


Re: Han Nom and the Unihan Database
Posted by: nnt (---.w82-121.abo.wanadoo.fr)
Date: April 06, 2005 07:29PM
Hoc Ngo wrote:

> Do đó, mọi sự hiệu
> đính có lẽ phải thông qua đại diện này.
>

I don't think so. Membership of the Unicode consortium is just a matter of fees.

You can see the conditions at the webpage:
[www.unicode.org]

I have italicized the interesing parts here :

Quote:
The Unicode Consortium counts among its members: corporations, governments, research and educational institutions, industry groups and associations, and individuals who seek to extend, maintain and promote The Unicode Standard and other standards related to internationalization technologies.

The Unicode Consortium invites organizations to take a leading role in the Consortium's international standards work, which plays a fundamental role in core modern technology such as XML, Java, and Windows. Membership in the Unicode Consortium offers you and your company or organization the opportunity to join in further development of the Unicode Consortium projects,
[...]
Annual Membership Fees
FULL $12,000
SUPPORTING $6,000
ASSOCIATE $2,000 for-profit $1,200 non-profit
LIAISON By invitation only
INDIVIDUAL $120


Hoc Ngo wrote:

>Nhưng điều làm tôi ngạc nhiên nhất là cột chữ >Quốc ngữ có rất nhiều từ, tuy phát âm được, >nhưng hoàn toàn xa lạ không hề có trong nhiều >tự điển Việt Nam hoặc Hán Việt mà tôi hiện có

These are NOT typos,but Nôm readings, mixed with Hán Việt readings.

That's why you won't find them in a Hán Việt Dictionary but in a Nôm dictionary. The confusion of Nôm and Han/viet in the same field ("kVietnamese") only leads to confusion and only makes it worse.

Japanese are more scientific (and not less nationalistic ) when they separate On/kun readings of the same Kanji characters.

Nota:I purposedly write in English in order for those interested in Nôm and Han/viet (but less fluent in Vietnamese) to read/join the thread.

Re: Han Nom and the Unihan Database
Posted by: Hoc Ngo (216.52.22.---)
Date: April 06, 2005 08:15PM
Thanks for your info.

Anyone can join Unicode for a fee. But it's not clear if one can successfully request adding new characters or fixing existing ones. The common practice and the easiest way is to define a national standard and present it to the Unicode consortium. This is normally done by national bodies. But that does not mean individuals cannot do it. It is possible but very hard. For example, even Apple Computer, a founding member of Unicode, cannot get its Apple logo (character 0xF0 in Mac Roman codepage) into the Unicode standard because one of the criteria of accepting a new character into Unicode is that the character must be present in a "national" standard.

> That's why you won't find them in a Hán Việt Dictionary but in a Nôm dictionary.

But what I am curious is why a number of Vietnamese words (in Quoc Ngu) do not appear even in Vietnamese-Vietnamese dictionaries. Are they just the sound of the Nom characters and are now obsolete? My thinking is that Nom characters are more or less pure Vietnamese, hence they should be listed in Vietnamese dictionaries.

I agree the present listing of Hán/Nôm characters in unihan.txt is flawed. There should be two keys, kHanViet and kNomViet, instead of a single key kVietnamese. This would clear up the confusion about the nature of each character. It would be beneficial to everyone if Vietnamese scholars with Han Nom expertise compile and agree on a list and send it to the Unicode consortium or post on the Internet. It's important this list be open to the public so that it can become a standard, just ike the Unicode standard. We badly need a standard list for information interchange and reference.

Just a thought.

Hoc


Re: Han Nom and the Unihan Database
Posted by: nnt (---.w82-121.abo.wanadoo.fr)
Date: April 06, 2005 08:44PM
Hoc Ngo wrote:

>This is normally done by national bodies. But
> that does not mean individuals cannot do it. It is possible
> but very hard. ...the criteria of accepting a new character into Unicode is that
> the character must be present in a "national" standard.

IMHO, even if you cannot introduce new characters/glyphs, you can perhaps give an opinion or participate in the debates.

> But what I am curious is why a number of Vietnamese words (in
> Quoc Ngu) do not appear even in Vietnamese-Vietnamese
> dictionaries. Are they just the sound of the Nom characters
> and are now obsolete? My thinking is that Nom characters are
> more or less pure Vietnamese, hence they should be listed in
> Vietnamese dictionaries.

IMHO, Nôm is Vietnamese, not "more or less ". Besides, what is "pure " Vietnamese ? smiling smiley

Vietnamese dictionaries tend to be present day Vietnamese dictionaries, just like dictionaries in other languages. For example, in France, the famous Larousse is waited each year (like the Beaujolais) for its "in/out" list of obsolete/new words...

Obsolete Vietnamese words can be very funny too (" dái " in Thiên Nam Ngữ Lục means "sợ ", not what you may think. smiling smiley . To put them in a modern Vietnamese dictionary may also lead to funny sentences too ...

Re: Han Nom and the Unihan Database
Posted by: Khúc Thần (---.fbx.proxad.net)
Date: April 06, 2005 11:43PM
Bác Hoc Ngo kính,

Bác có nói là trước đây Bác có tham gia vào việc đưa chữ quốc ngữ vào Unicode. Vậy chắc Bác cũng hiểu rõ việc cấp mã, v.v...

Tui có một câu hỏi nhỏ nhưng làm cho tui khó chịu lắm từ bấy lâu nay. Tui không thể gõ lại được những tác phẩm chữ quốc ngữ xưa như các công trình của Alexandro de Rhodes, Văn Tín,... Những chữ cái đặc biệt đó hiện ta không thể gõ được. Nếu bây giờ ta muốn xin mã thì phải như thế nào.

Nếu Bác có ý kiến gì thì xin cho tui biết với. Xin cám ơn Bác trước.

Kính

Khúc Thần

Re: Han Nom and the Unihan Database
Posted by: nnt (---.w82-121.abo.wanadoo.fr)
Date: April 07, 2005 12:23AM
FRom an interesting link

[ptolemy.tlg.uci.edu]

abot the issues in Unicode standardisation

Quote:

[...]it is difficult to establish rules for what characters are truly platonic enough ideals to warrant inclusion in Unicode, and which do not. We've seen that Coptic was conflated with Greek, and soon will not be, for example. The more general issue is, what should be counted as a distinct character, and what should be counted only as a variant character, which need be differentiated only through markup. (For instance, the difference between a and a.) This issue is clear in well-established modern scripts, with a history of standardisation and a well-defined repertoire.

In historical scripts, and particularly poorly understood, partly deciphered or undeciphered scripts, this issue is much murkier. It is so murky, in fact, that specialists have concluded it is pointless to even attempt to derive a repertoire of codepoints for inclusion in Unicode:

For poorly understood scripts, we don't know which characters are distinct, and which are merely variants of each other.
Since Unicode is a standard For The Ages, we cannot decide on one repertoire of codepoints today, and shift to a smaller or bigger repertoire when we know more: Unicode needs to get things right from the get-go, or we will be stuck with errors in perpetuity.
Ergo, no Easter Island script for you.
But there's more. When we know enough of a script to publish texts in it, we form a standardised repertoire of graphemes to put such texts in. In doing so, we generalise from whatever variations may have in the script through time and space. Fraktur a and Celtic a are shaped quite differently, as are the a written in Roman in 400 AD and in 900 AD; but we represent all of these as a Latin Small Letter A.

Now, scholars understand enough about Egyptian Hieroglyphics, Sumerian Cuneiform, and Ogham to be able to publish texts in them. A photograph of the stone or tablet obviously does not count as publication: the scholar needs to reduce the glyphs in the original to a standardised set of graphemes, fix any errors, fill in gaps and so forth. So in most instances, you won't care whether the Ogham glyph for "b" was at a 65° or 70° angle; you just want to know that it was an "b". (And if you really wanted to know, you can always refer to the photo.)
[...]

The preceding does not do justice to Carl-Martin Bunz's patient exposition Encoding Scripts from the Past, which constituted Unicode Technical Note #3. Nor does it really convey the tension that must have given rise to Bunz writing his note: reading between the lines (and the standard disclaimers apply), it is apparent that Unicode implementers, who would dearly love to implement hieroglyphics and cuneiform, think of the academics as spoilsports who are getting in the way of their scriptal delights—and have let them know it.

But the bottom line is, standardisation for such scripts is hard, and the people who would do the standardisation don't need it.

For an example of the "don't need it" reaction, see the DIN (German Standards body) response to the proposal on Meroitic [anubis.dkuug.dk]
, and on Egyptian hieroglyphs.[anubis.dkuug.dk]



Re: Han Nom and the Unihan Database
Posted by: Hoc Ngo (---.dsl.snfc21.pacbell.net)
Date: April 07, 2005 09:19AM
Xin lỗi bác Khúc Thần tôi xin trả lời bằng tiếng Anh để mọi người cùng tham gia.

It is a difficult process to request the Unicode Consortium encode characters that are not officially in a national standard. That was the case of Vietnamese characters in the 1989-1992 time frame. There was no Vietnamese national standard at all and the Vietnamese government did not participate in the process. So a number of oversea Vietnamese professionals ([url]www.vietstd.org[/url]) had to wage a world-wide campaign to force the Unicode Consortium into accepting 90 precomposed Vietnamese characters into the standard.

FYI, there are 134 Vietnamese specific letters that are not present in the ASCII standard. But 44 Vietnamese specific letters are present in other European codepages (e.g. French, Italian, etc). So that leaves 90 charaters unaccounted for, and the
Unicode Consortium adamantly refused to give us 90 codepoints. Yes, just 90 codepoints. They argued that codepoints for accent marks were already defined and we could simply combine them with base letters to form the missing Vietnamese letters.

True, we can combine existing accent marks to form letters that are not readily available in the standard. This approach gives what is known as composed characters. But this is done at the expense of more processing time and more storage, not to mention about the ugly look and feel of the accent marks. In theory, a single accent mark, e.g., ^, can combine with "a" to give â, or with "A" to give Â. But in practice, the computer has to overlay the image of the symbol ^ over the "a" to give the appearance of â. What happens is the image of ^ has a fixed height and width. Thus if the height of ^ fits well with "a", it is too short to fit with "A". Needless to say, the result is a disaster when we try to overlay ^ over "A".

That's why the VietStd group fought very hard with the Unicode Consortium to get the remaining 90 characters into the standard so that each and every Vietnamese letter can have its own graphic image predesigned. In this way, we will not have the accent mark shifting problem caused by the different heights and widths of the base letters.

After a series of long meetings and heated debates the Unicode Consortium yielded.
And now we enjoy having all Latin-based Vietnamese letters in Unicode Standard 2.x

Now that the Unicode Standard is open to 17 planes for about 1 million characters, the process may be easier. The Vietnamese government can submit a list of historical Vietnamese characters to Unicode for consideration.

In the meantime, if you want to use them, first try to use existing marks to see if
you can get them by combining some base letters and accent marks.

If you can scan these letters and send to me, I can probably give you some help.

Thanks for your question.

Học

Re: Han Nom and the Unihan Database
Posted by: Khúc Thần (---.fbx.proxad.net)
Date: April 07, 2005 09:50AM
Xin cám ơn Anh Hoc Ngo rất nhiều đã giải thích rất rõ về việc này.

Tui không có ý đặt lại thành vấn đề những thành tựu đã gặt được bằng mồ hôi nước mắt củ người Việt ở hải ngoại. Về những chữ quốc ngữ lịch sử thì tui đã để chúng ở đâu đó trong một CD rồi. Khó có thể tìm lại được. Có lẽ tui sẽ thử coi lại vấn đề rồi có gì tui sẽ gởi Anh để tham khảo ý kiến của Anh.

Xin cám ơn Anh nhiều lắm.

Kính

Khúc Thần

Re: Han Nom and the Unihan Database
Posted by: Toan (---.ptr.terago.ca)
Date: April 07, 2005 09:52AM
It is a difficult process to request the Unicode Consortium encode characters that are not officially in a national standard. That was the case of Vietnamese characters in the 1989-1992 time frame. There was no Vietnamese national standard at all and the Vietnamese government did not participate in the process. So a number of oversea Vietnamese professionals (www.vietstd.org) had to wage a world-wide campaign to force the Unicode Consortium into accepting 90 precomposed Vietnamese characters into the standard.

Bản dịch smiling smiley
C'est un processus difficile de demander au Consortium d'Unicode d'encoder les caractères qui ne sont pas officiellement dans une norme nationale. C'était le cas des caractères vietnamiens dans la peridode de temps 1989-1992. Il n'y avait aucune norme nationale vietnamienne du tout et le gouvernement vietnamien n'a pas participé au processus. De sorte qu'un certain nombre de professionnels vietnamiens hors du pays () ont dû faire une campagne mondiale pour forcer le Consortium d'Unicode d' accepter 90 precomposed les caractères vietnamiens dans la norme.

Re: Han Nom and the Unihan Database
Posted by: Hoc Ngo (216.52.22.---)
Date: April 07, 2005 11:54AM
Thank you bác Toàn for the translation.

Thank you bác Khúc Thần for letting us know that there are still historical Vietnamese letters not encoded in the Unicode standard. I just wanted to share my own experience with the Unicode Consortium so that future efforts can be directed effectively by following a standard procedure.

FYI, soon after the success of getting modern Latin-based Vietnamese letters into Unicode, I began researching Latin-based Chàm letters in the hope of bringing them to the attention of the Unicode Working Committee as well. I gathered a number of Cham letters based on a book by Nguyễn Khắc Ngữ. I tried to contact the author but unfortunately the rumor had it that he had passed away a few years earlier. I wrote to Vien Tin Hoc in Ha noi to inform them of the need to submit all letters that have ever been used by Vietnamese, Kinh or ethnic minorities, to the Unicode Consortium. My proposal went unanswered.

I'm very interested in what the historical Vietnamese alphabet looks like. What accent marks were used? If we cannot use the existing accent marks in Unicode, we can at least encode them in the private user character area in Unicode and develop fonts to display them properly. Although using the private area defeats the information interchange purpose of a standard, at least we can share/store text electronically while waiting for the Unicode Consortium to put these characters in some higher planes.

So I am looking forward to seeing your characters very soon.

Thank you very much.

Hoc


Re: Han Nom and the Unihan Database
Posted by: Khúc Thần (---.fbx.proxad.net)
Date: April 07, 2005 12:34PM
Sorry to write in French, because my English is still not enough to express...

Je pense que votre suggestion a été tacitement prise en compte et que les représantants vietnamiens (dont Ngô Thanh Nhàn,...) travaillent depuis quelque temps sur la question (me semble-t-il).

Il y a bien d'autres écritures très orginales ayant ou ayant eu cours sur le territoire vietnamien (chez le minorités essentiellement), qui ne demandent qu'à être intégrées dans l'Unicode. Je ne sais pas si un effort a été fourni dans ce sens. Mais tant que rien n'est sérieusement fait sur le plan national (normes nationales), rien ne pourra vraiment marcher sur la plan international.

La norme vietnamienne en matière du nôm a été réalisée, à mon sentiment, avec indifférence, puis précipitation, voire même négligence. Ceci nous conduit à quelques aberrations qu'on peut observer dans la liste des caractères que nous connaissons tous. Il n'est pas question de faire le procès de quoi ou de qui que ce soit. Seuls importent les impacts et conséquences sur ce qui découle des >4000 caractères spécifiquement nôm attribués (thuần nôm)...

Sur Internet, on peut lire à loisir des articles sur la valeur nationale et internationale du nôm, sur le processus de codification, etc., etc. Mais depuis que les 9299 caractères contenus dans la liste proposée ont été approuvés et codés, aucun article n'a été écrit sur le résultat obtenu (pas de "feedback"). Or, il y a quand-même des choses à dire...

J'ai entendu dire que le Vietnam envisage de revenir (=commencer?) à un codage national propre. Je n'ai aucune information précise sur la question, mais cela mérite réflexion de la part de tous.

Khúc Thần

Re: Han Nom and the Unihan Database
Posted by: Hoc Ngo (216.52.22.---)
Date: April 07, 2005 12:58PM
Xin bác Khúc Thần dịch sang tiếng Việt dùm vì khả năng tiếng Pháp của tôi quá bết.

Cám ơn bác.

Học


Re: Han Nom and the Unihan Database
Posted by: nnt (---.w82-121.abo.wanadoo.fr)
Date: April 07, 2005 01:57PM
A quick translation of KT post :


"I think your suggestion has tacitly been taken into account, ant that the VN representatives (among whom M. NTN) have been working on that for a while (as it seems to me)

There are many other unique scripts used in Vietnam (among ethnic minorities essentially) which are just waitingto be included into Unicodẹ I don't know if any effort has been taken in this direction. But so long as nothing has been achieved at a national level (national standard), nothing will really work at international level.

The Vietnamese standard concerning Nôm has been done with much lack of concern , haste and carelessness. That has lead to a few aberrations we can see in the list of characters we all know.
It is out of question to put anything on trial. What only matters are the 4000 pure Nôm characters/codes which have been included.

On the internet, we can read many articles about Nôm, the codification process, etc... But till now, there has been no feedback on the results, once the 92999 characters have been approved. Yet much can be said about it.

I 've heard that VN is planning to go back to/begin a specific national codification. I have no precise information about this subject, but it deserves our attention ."

Goto Page: Previous123Next
Current Page: 2 of 3


Your Name: 
Your Email: 
Subject: 
Việt mode:     Off   Telex   VNI   VIQR   Combination
Powered by phpWebSite ©.       Theme design © Sharondippity