mbtowc
From cppreference.com
| ヘッダー <stdlib.h> で定義 |
||
| int mbtowc( wchar_t* pwc, const char* s, size_t n ) |
(C99まで) | |
| int mbtowc( wchar_t* restrict pwc, const char* restrict s, size_t n ) |
(C99以降) | |
s で指されるマルチバイト文字の最初のバイトをワイド文字に変換します。変換されたワイド文字は、*pwc がヌルポインタでない場合に *pwc に書き込まれます。
s がヌルポインタの場合、グローバル変換状態をリセットし、シフトシーケンスが使用されるかどうかを判断します。
目次 |
[編集] 注記
mbtowc の各呼び出しは、内部のグローバル変換状態(この関数のみが認識する mbstate_t 型の静的オブジェクト)を更新します。マルチバイトエンコーディングがシフト状態を使用する場合、後戻りや複数回のスキャンを避けるために注意が必要です。いずれの場合も、複数のスレッドは同期なしで mbtowc を呼び出すべきではありません。代わりに mbrtowc を使用できます。
[編集] パラメータ
| pwc | - | 出力用のワイド文字へのポインタ |
| s | - | マルチバイト文字へのポインタ |
| n | - | 検査できるs内のバイト数の制限 |
[編集] 戻り値
s がヌルポインタでない場合、マルチバイト文字に含まれるバイト数を返します。 s で指される最初のバイトが有効なマルチバイト文字を形成しない場合は -1 を返します。 s がヌル文字 '\0' を指している場合は 0 を返します。
s がヌルポインタの場合、内部変換状態を初期シフト状態を表すようにリセットし、現在のマルチバイトエンコーディングが状態に依存しない(シフトシーケンスを使用しない)場合は 0 を返し、現在のマルチバイトエンコーディングが状態に依存する(シフトシーケンスを使用する)場合はゼロ以外の値を返します。
[編集] 例
このコードを実行
#include <locale.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <wchar.h> // print multibyte string to wide-oriented stdout // equivalent to wprintf(L"%s\n", ptr); void print_mb(const char* ptr) { mbtowc(NULL, NULL, 0); // reset the conversion state const char* end = ptr + strlen(ptr); int ret = 0; for (wchar_t wc; (ret = mbtowc(&wc, ptr, end - ptr)) > 0; ptr += ret) wprintf(L"%lc", wc); wprintf(L"\n"); } int main(void) { setlocale(LC_ALL, "en_US.utf8"); // UTF-8 narrow multibyte encoding print_mb("z\u00df\u6c34\U0001F34C"); // or "zß水🍌" }
出力
zß水🍌
[編集] 参照
- C23標準 (ISO/IEC 9899:2024)
- 7.24.7.2 The mbtowc function (p: TBD)
- C17標準 (ISO/IEC 9899:2018)
- 7.22.7.2 The mbtowc function (p: 260)
- C11標準 (ISO/IEC 9899:2011)
- 7.22.7.2 The mbtowc function (p: 358)
- C99標準 (ISO/IEC 9899:1999)
- 7.20.7.2 The mbtowc function (p: 322)
- C89/C90標準 (ISO/IEC 9899:1990)
- 4.10.7.2 The mbtowc function
[編集] 関連項目
| (C95) |
与えられた状態で、次のマルチバイト文字をワイド文字に変換する (関数) |
| 次のマルチバイト文字のバイト数を返す (関数) | |
| C++ ドキュメント for mbtowc
| |