Author Archives: 고싱가

팔리어, 희랍어 출력 테스트

유니코드의 코드넘버를 이용해서 팔리어, 산스크리트어, 희랍어를 웹상에 출력해 보면 그 결과는 어떨까?. 모질라의 불여우(Firefox), 오페라(Opera) 등의 웹 브라우저에서는 모든 언어가 완벽하게 출력되지만, IE(인터넷 익스플로러)에서는 희랍어 중 Normalization Form D를 이용한 방식만 제대로 출력된다.

IE가 위의 언어들을 제대로 출력하지 못하는 까닭은 최신버전인 IE 6.0조차 유니코드 문자집합(character set)을 제대로 지원하지 않기 때문이다. IE는 라틴문자 문자집합 중에서 Basic Latin, Latin-1, Latin Extended A, Latin Extended B 문자집합만 지원한다. 팔리어나 (라틴문자로 음사된romanized) 산스크리트어를 웹에서 출력하자면 Latin Extended Additional 문자집합을 이용해야 하는데, 유감스럽게도 IE는 이 문자집합을 지원하지 않는 셈이다.

희랍어의 경우도 사정은 마찬가지다. IE는 희랍어 기본 알파벳의 문자집합인 Greek만 지원하고 확장문자집합인 Greek Extended는 지원하지 않는다. 따라서 IE는 완성형 희랍어(Normalization Form C)로는 희랍어를 출력할 수 없고, Greek Extended 문자집합을 이용하지 않는 조합형 희랍어(Normalization Form D)로만 출력할 수 있다. 물론 다른 웹 브라우저에서는 어느 형의 희랍어든 완벽하게 출력된다. 다음의 문장들을 각각의 웹 브라우저에서 확인해 보라.

ekuunati.mso vayasaa Subbhadda
ya.m pabbaji.m ki.mkusalaanuesii.
vassaani pa~n~naasasamaadhikaani
yato aha.m pabbajito Subhadda
~naayassa dhammassa padesavattii.
ito bahiddhaa sama.no pi n’ atthi.

evam mayaa `srutam. ekasmin samaye Bhagavaa~n `Sraavastyaa.m viharati sma Jetavane ‘naathapi.n.dadasya aaraame mahataabhik.susa.mghena saarddham ardhatrayoda`sabhir bhik.su`satai.h sa.mbahulai`s ca bodhisattvair mahaasattvai.h.

τῆς ἠπείρου τῆς Ἑλληνικῆς κατὰ νήσους τὰς Κυκλάδας καὶ πέλαγος τὸ Αἰγαῖον ἄκρα+ Σούνιον πρόκειται γῆς τῆς Ἀττικῆς: καὶ λιμήν τε παραπλεύσαντι τὴν ἄκραν ἐστὶ καὶ ναὸς Ἀθηνᾶς Σουνιάδος ἐπὶ κορυφῇ τῆς ἄκρας.
( Normalization Form C, Greek )
 

τη̂ς ἠπείρου τη̂ς ̔Ελληνικη̂ς κατὰ νήσους τὰς Κυκλάδας καὶ πέλαγος τὸ Αἰγαι̂ον ἄκρα+ Σούνιον πρόκειται γη̂ς τη̂ς ̓Αττικη̂ς: καὶ λιμήν τε παραπλεύσαντι τὴν ἄκραν ἐστὶ καὶ ναὸς ̓Αθηνα̂ς Σουνιάδος ἐπὶ κορυφῃ̂ τη̂ς ἄκρας.
( Normalization Form D, Greek )
 

(위의 문장들은 Firefox, Opera 등 Unicode 2.0+를 충실히 지원하는 웹 브라저에서만 제대로 출력된다.)

행여 내가 설치한 IE가 망가졌거나 세부설정을 잘못한 것은 아닐까 하는 의구심에 각종 테스트를 해 보고 세부설정을 이리저리 변경해 보았으나 별무신통이었다. 그러다가 Alan Wood’s Unicode Resources 웹 페이지를 보고 내 잘못이 아니라 IE 자체가 유니코드를 제대로 지원하지 않는다는 확인을 하였다. 각 웹 브라우저들의 희랍문자, 라틴문자 문자집합 지원 여부를 테스트 해 본 결과, 다음과 같은 결과치를 얻었다:

웹 브라우저들의 문자집합 지원 여부

Latin & Greek Character Set
IE 6.0
Firefox
Opera
Basic Latin
O
O
O
Latin-1
O
O
O
Latin Extended A
O
O
O
Latin Extended B
O
O
O
Latin Extended Additional
X
O
O
Greek
O
O
O
Greek Extended
X
O
O

그러므로 웹 상에서 팔리어를 출력하자면 이용자에게 불여우나 오페라를 사용하라고 권하든가 아니면 팔리어 출력 자체를 포기하는 수밖에 없다. 희랍어의 경우에는, 현재로서는, 완성형 희랍어로 희랍어를 출력해야만 IE를 포함한 모든 웹 브라우저에서 희랍어를 제대로 출력할 수 있다. 완성형 희랍어냐 조합형 희랍어냐 하는 논쟁은 Unicode Polytonic Greek for the World Wide Web을 참고하기 바란다. World Wide Web Consortium은 조합형 희랍어를 사용하는 Normalization Form D보다는 완성형 희랍어를 사용하는 Normalization Form C를 통하여 웹 출판을 하도록 권고하고 있다. (이 논쟁은 완성형/조합형 한글 논쟁과 매우 유사하여 흥미롭다.)

아무튼 Microsoft의 IE가 유니코드 문자들을 제대로 지원하지 않는 바람에 각종 소수언어의 웹 출판이 제대로 이루어지지 못하고 있는 실정이다. Windows XP에서 기본으로 제공하는 다이어트 프로그램인 메모장도 유니코드를 완벽하게 지원하는 판에 왜 유독 IE만 제대로 지원하지 않는 것일까? 불여우, 오페라보다 굉장히 무거운 프로그램이면서도 유니코드조차 제대로 지원하지 못하는 인터넷 익스플로러는 도대체 뭐하는 물건인가? 향후 출시될 IE 7.0에서는 부디 유니코드 문자들을 제대로 지원해 주었으면 하는 바람뿐이다.
 

앨런 우드의 Unicode and Multilingual Web Browsers에서는 IE의 이러한 단점을 고려하여 다음과 같은 깔끔한 권고를 하고 있다:

Although Microsoft’s Internet Explorer browser is widely used, it does not have as good Unicode support as some of its competitors. For better Unicode support, you may like to consider installing and using either Firefox or Opera, both of which are available for Windows, Mac and other operating systems.

Microsoft의 IE 브라우저가 폭넓게 사용되기는 하지만, IE는 다른 경쟁 브라우저에 비해 유니코드 지원을 제대로 하지 않고 있다. 좀더 나은 유니코드 지원을 받자면 Firefox나 Opera를 설치하여 사용하는 편을 고려해 볼 만하다. 두 브라우저 모두 Windows, Mac, 기타 운영체제에서 사용 가능하다.

Get Firefox!       Download Opera