Xử lý tiếng Nhật với PHP MySQL

Một số khái niệm

Các loại mã ký tự

ISO-2022-JP, Shift_JIS, EUC-JP, Unicode.

PHP và tiếng Nhật.

Cách convert các encoding tiếng Nhật trong PHP

Cấu hình MySQL

Cách hiển thị ở HTML.

Web server

Client (browser)

 

 

 

ppt12 trang | Chuyên mục: MySQL | Chia sẻ: dkS00TYs | Lượt xem: 2882 | Lượt tải: 1download
Tóm tắt nội dung Xử lý tiếng Nhật với PHP MySQL, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
Xử lý tiếng Nhật với PHP/MySQL Nguyen Vu Hung vuhung@vinicorp.com.vn 2009/11/09 Agenda Một số khái niệm Các loại mã ký tự ISO-2022-JP, Shift_JIS, EUC-JP, Unicode. PHP và tiếng Nhật. Cách convert các encoding tiếng Nhật trong PHP Cấu hình MySQL Cách hiển thị ở HTML. Web server Client (browser) Một số khái niệm Zenkaku/Hankaku: Ký tự tiếng Nhật 2 bytes và 1 byte. Mô hình hệ thống OS (Linux, Windows) Web Server (Apache) PHP MySQL User (Browser) Dữ liệu ngoài Convert Convert Các loại mã tiếng Nhật Tham khảo:  PHP và tiếng Nhật Khi cài đặt cần các option sau --enable-mbstring : mbstring 関数を有効にします。このオプションは、 mbstring 関数を利用するために必要です。 --enable-mbstr-enc-trans : mbstring変換エンジンを使用したHTTP入力の文 字エンコーディング変換を有効にします。この機能が有効の場合、 HTTP入力文字エンコーディングは、自動的に mbstring.internal_encodingに変換されます。 Confirm bằng cách xem phpinfo() Các hàm xử lý multibyte (xem 2 trang sau) Multibyte functions(1) mb_convert_case -- 文字列に対してケースフォルディングを行うmb_convert_encoding -- 文字エンコーディングを変換するmb_convert_kana -- カナを("全角かな"、"半角かな"等に)変換する mb_convert_variables -- 変数の文字コードを変換するmb_decode_mimeheader -- MIMEヘッダフィールドの文字列をデコードするmb_decode_numericentity -- HTML数値エンティティを文字にデコードする mb_detect_encoding -- 文字エンコーディングを検出するmb_detect_order -- 文字エンコーディング検出順序の設定/取得 mb_encode_mimeheader -- MIMEヘッダの文字列をエンコードするmb_encode_numericentity -- 文字をHTML数値エンティティにエンコードする mb_ereg_match -- マルチバイト文字列が正規表現に一致するか調べるmb_ereg_replace -- マルチバイト文字列に正規表現による置換を行うmb_ereg_search_getpos -- 次の正規表現検索を開始する位置を取得する mb_ereg_search_getregs -- マルチバイト文字列が正規表現に一致する部分があるか調べる mb_ereg_search_init -- マルチバイト正規表現検索用の文字列と正規表現を設定する mb_ereg_search_pos -- 指定したマルチバイト文字列が正規表現に一致する部分の位置と長さを返 す mb_ereg_search_regs -- 指定したマルチバイト文字列が正規表現に一致する部分を取得する mb_ereg_search_setpos -- 次の正規表現検索を開始する位置を設定する mb_ereg_search -- 指定したマルチバイト文字列が正規表現に一致するか調べる mb_ereg -- マルチバイト文字列に正規表現マッチを行うmb_eregi_replace -- マルチバイト文字列に大文字小文字を区別せずに正規表現による置換を行う mb_eregi -- マルチバイト文字列に大文字小文字を区別しない正規表現マッチを行う  Màu đỏ: Các hàm hay dùng Tham khảo:  Multibyte functions(2) mb_get_info -- mbstringの内部設定値を取得するmb_http_input -- HTTP入力文字エンコーディングの検出mb_http_output -- HTTP出力文字エンコーディングの設定/取得mb_internal_encoding -- 内部文字エンコーディングの設定/取得 mb_language -- カレントの言語を設定/取得 mb_output_handler -- 出力バッファ内で文字エンコーディングを変換するコールバック関数 mb_parse_str -- GET/POST/COOKIEデータをパースし、グローバル変数を設定する mb_preferred_mime_name -- MIME文字設定を文字列で得るmb_regex_encoding -- カレントの正規表現用のエンコーディングを文字列として返す mb_regex_set_options -- マルチバイト正規表現関数のデフォルトオプションを取得または設定する mb_send_mail -- エンコード変換を行ってメールを送信する mb_split -- マルチバイト文字列を正規表現により分割するmb_strcut -- 文字列の一部を得るmb_strimwidth -- 指定した幅で文字列を丸めるmb_strlen -- 文字列の長さを得るmb_strpos -- 文字列の中に指定した文字列が最初に現れる位置を見つける mb_strrpos -- 文字列の中に指定した文字列が最後に現れる位置を見つける mb_strtolower -- 文字列を小文字にするmb_strtoupper -- 文字列を大文字にするmb_strwidth -- 文字列の幅を返すmb_substitute_character -- 置換文字の設定/入手mb_substr_count -- 副文字列の出現関数を数えるmb_substr -- 文字列の一部を得る Tham khảo:  Màu đỏ: Các hàm hay dùng Encoding Conversion mb_convert_encoding mb_convert_encoding ( string $str, string $to_encoding [, mixed $from_encoding] ) Hỗ trợ các encoding: ASCII, JIS, UTF-8, EUC-JP, SJIS mb_convert_encoding($str, "EUC-JP", "auto"): Convert tự động sau EUC-JP (Có thể không hoàn hảo). mb_convert_encoding($str, "EUC-JP", "UTF-8"); iconv (thư viện riêng) iconv ( string $in_charset , string $out_charset , string $str) Tham khảo:  Cấu hình MySQL MySQL hỗ trợ EUC (ujis), ShiftJIS(sjis). Các MySQL binary built sẵn mặc định hỗ trợ tiếng Nhật. Khi tạo cơ sở dữ liệu, encoding set là utf8_general_ci Cách hiển thị tiếng Nhật ở HTML Cần chỉ định charset trong HTML header Web server Apache: Mặc định hỗ trợ tiếng Nhật httpd.conf: Đặt default charset. AddDefaultCharset utf-8 Clients (browser) PC tiếng Nhật: Không có vấn đề về hiển thị Di động: Sẽ xem xét riêng. Shift_JIS toàn trong đa số trường hợp. 

File đính kèm:

  • pptXử lý tiếng Nhật với PHP MySQL.ppt
Tài liệu liên quan