名前空間
変種
操作

std::scanf、std::fscanf、std::sscanf

From cppreference.com
< cpp‎ | io‎ | c
 
 
 
C形式I/O
型とオブジェクト
関数
ファイルアクセス
直接入出力
非書式化入出力
書式付き入力
scanffscanfsscanf
(C++11)(C++11)(C++11)    
(C++11)(C++11)(C++11)    
書式付き出力
ファイルポジショニング
エラーハンドリング
ファイル操作
 
ヘッダ<cstdio>で定義
int scanf( const char* format, ... );
(1)
int fscanf( std::FILE* stream, const char* format, ... );
(2)
int sscanf( const char* buffer, const char* format, ... );
(3)

さまざまなソースからデータを読み込み、format に従って解釈し、結果を指定された場所に格納します。

1) stdin からデータを読み込みます。
2) ファイルストリーム stream からデータを読み込みます。
3) null終端の文字列表現である buffer からデータを読み込みます。

目次

[編集] パラメータ

stream - 読み込む入力ファイルストリーム
buffer - 読み込むヌル終端された文字列へのポインタ
format - 入力をどのように読み込むかを指定するヌル終端された文字列へのポインタ
... - 受け取る引数

format 文字列は以下で構成されます。

  • 空白文字でないマルチバイト文字(% を除く):フォーマット文字列中のそのような各文字は、入力ストリームから同一の文字を1つ消費するか、ストリームの次の文字が一致しない場合に、関数の失敗を引き起こします。
  • 空白文字:フォーマット文字列中の任意の1つの空白文字は、入力から利用可能な連続するすべての空白文字を消費します(std::isspace をループで呼び出した場合と同じように決定されます)。フォーマット文字列中の "\n"" ""\t\t"、またはその他の空白文字の間には、違いがありません。
  • 変換指定。各変換指定は次の形式です。
  • 先行する % 文字。
  • (オプション) 代入抑制文字 *。このオプションが存在する場合、関数は変換の結果を受信引数に代入しません。
  • (オプション) 整数(1より大きい)で、最大フィールド幅を指定します。これは、現在の変換指定子によって指定された変換を実行する際に、関数が消費することを許可される最大文字数です。 %s および %[ は、幅が指定されていない場合、バッファオーバーフローを引き起こす可能性があることに注意してください。
  • (オプション) 受け取る引数のサイズ、つまり実際の宛先型を指定する 長さ修飾子。これは変換精度とオーバーフロー規則に影響します。デフォルトの宛先型は変換型ごとに異なります(下記の表を参照)。
  • 変換フォーマット指定子。

以下のフォーマット指定子が利用可能です

変換
指定子
説明 期待される
引数型
長さ修飾子→ hh h なし l ll j z t L
C++11からのみ利用可能→ はい はい はい はい はい
%
リテラル % にマッチします。
N/A N/A N/A N/A N/A N/A N/A N/A N/A
c

文字 または 文字のシーケンス にマッチします。

  • 幅指定子が使用されている場合、正確に width 個の文字にマッチします(引数は十分なスペースを持つ配列へのポインタでなければなりません)。
  • %s および %[ とは異なり、ヌル文字を配列に追加しません。
N/A N/A
char*
wchar_t*
N/A N/A N/A N/A N/A
s

非空白文字のシーケンス(文字列)にマッチします。

  • 幅指定子が使用されている場合、width 個まで、または最初の空白文字まで(どちらか早い方)にマッチします。
  • マッチした文字に加えて常にヌル文字を格納します(したがって、引数配列は少なくとも width+1 文字のスペースが必要です)。
[set ]

set 文字セットからの空でない文字シーケンスにマッチします。

  • セットの最初の文字が ^ の場合、セットに含まれないすべての文字にマッチします。
  • セットが ] または ^] で始まる場合、] 文字もセットに含まれます。
  • スキャンセット内の非初期位置にある - 文字が、[0-9] のように範囲を示すかどうかは、実装定義です。
  • 幅指定子が使用されている場合、width までのみマッチします。
  • マッチした文字に加えて常にヌル文字を格納します(したがって、引数配列は少なくとも width+1 文字のスペースが必要です)。
d

10進整数 にマッチします。

  • 数値のフォーマットは、10base 引数として、std::strtol が期待するフォーマットと同じです。
signed char* または unsigned char*
signed short* または unsigned short*
signed int* または unsigned int*
signed long* または unsigned long*
signed long long* または unsigned long long*
N/A
i

整数 にマッチします。

  • 数値のフォーマットは、0base 引数として(解析された最初の文字によって基数が決定されます)、std::strtol が期待するフォーマットと同じです。
u

符号なし 10進整数 にマッチします。

  • 数値のフォーマットは、10base 引数として、std::strtoul が期待するフォーマットと同じです。
o

符号なし 8進整数 にマッチします。

  • 数値のフォーマットは、8base 引数として、std::strtoul が期待するフォーマットと同じです。
x
X

符号なし 16進整数 にマッチします。

  • 数値のフォーマットは、16base 引数として、std::strtoul が期待するフォーマットと同じです。
n

これまでに読み取った文字数 を返します。

  • 入力は消費されません。代入カウントは増加しません。
  • 指定子に代入抑制演算子が定義されている場合、動作は未定義です。
a (C++11)
A (C++11)
e
E
f
F (C++11)
g
G

浮動小数点数 にマッチします。

  • 数値のフォーマットは、std::strtof が期待するフォーマットと同じです。
N/A N/A
float*
double*
N/A N/A N/A N/A
long double*
p

ポインタ を定義する実装定義の文字シーケンスにマッチします。

  • printf ファミリの関数は、%p 書式指定子を使用して同じシーケンスを生成するはずです。
N/A N/A
void**
N/A N/A N/A N/A N/A N/A
注釈

n 以外のすべての変換指定子について、指定されたフィールド幅を超えず、かつ変換指定子が期待するものと完全に一致するか、または期待されるシーケンスのプレフィックスとなるような、最も長い入力文字シーケンスがストリームから消費されます。この消費されたシーケンスの後の最初の文字は、読み込まれないまま残ります。消費されたシーケンスの長さがゼロであるか、または消費されたシーケンスを上記のように変換できない場合、マッチングエラーが発生します。ただし、ストリームからの入力がエンド・オブ・ファイル、エンコーディングエラー、または読み取りエラーによって妨げられた場合は、入力エラーとなります。

[cn 以外のすべての変換指定子は、入力を解析しようとする前に、すべての連続する空白文字(std::isspace を呼び出した場合と同じように決定されます)を消費して破棄します。これらの消費された文字は、指定された最大フィールド幅にはカウントされません。

変換指定子 lcls、および l[ は、最初の文字が変換される前にゼロに初期化された std::mbstate_t オブジェクトを使用して、std::mbrtowc を呼び出すのと同じように、マルチバイトからワイド文字への変換を実行します。

変換指定子 s および [ は、一致した文字に加えて常にnull終端文字を格納します。宛先配列のサイズは、指定されたフィールド幅より少なくとも1つ大きい必要があります。 %s または %[ を、宛先配列のサイズを指定せずに使用することは、std::gets と同様に危険です。

固定幅整数型(std::int8_t など)の正しい変換指定子は、ヘッダー <cinttypes> で定義されています(ただし、SCNdMAXSCNuMAX などは %jd%ju などと同義です)。

各変換指定子の処理後にはシーケンスポイントが存在します。これにより、複数のフィールドを同じ「シンク」変数に格納することが可能になります。

指数部分に数字がない不完全な浮動小数点値を解析する場合(例えば、変換指定子 %f"100er" を解析する場合)、シーケンス "100e"(おそらく有効な浮動小数点数の最も長いプレフィックス)が消費され、マッチングエラー(消費されたシーケンスは浮動小数点数に変換できない)が発生し、"r" が残ります。既存の実装の中には、この規則に従わず、"100" のみ消費するようにロールバックし、"er" を残すものがあります(例: glibc バグ 1765)。

変換指定子が不正な場合、動作は未定義です。

[編集] 戻り値

正常に代入された受け取る引数の数(最初の受け取る引数が代入される前にマッチングエラーが発生した場合はゼロになる可能性があります)、または最初の受け取る引数が代入される前に発生した入力エラーの場合は EOF

[編集] 複雑性

保証されません。特に、std::sscanf の一部の実装は O(N) です。ここで、N = std::strlen(buffer) です [1]。パフォーマンスの高い文字列解析については、std::from_chars を参照してください。

[編集] 注記

ほとんどの変換指定子は、まず連続する空白文字をすべて消費するため、以下のようなコードは

std::scanf("%d", &a);
std::scanf("%d", &b);

別の行に入力された2つの整数(最初の %d によって残された改行が2番目の %d によって消費される)または、スペースやタブで区切られた同じ行の2つの整数(最初の %d によって残されたスペースやタブが2番目の %d によって消費される)を読み込みます。

先頭の空白文字を消費しない変換指定子(例: %c)は、フォーマット文字列に空白文字を使用することで、先頭の空白文字を消費させることができます。
std::scanf("%d", &a);
std::scanf(" %c", &c); // ignore the endline after %d, then read a char

std::sscanf の一部の実装では std::strlen が呼び出され、実行時間が文字列全体の長さに比例する点に注意してください。これは、ループ内で std::sscanf を呼び出して文字列の先頭から繰り返し値を解析する場合、コードの実行時間が二次時間になる可能性があることを意味します()。

[編集]

#include <clocale>
#include <cstdio>
#include <iostream>
 
int main()
{
    int i, j;
    float x, y;
    char str1[10], str2[4];
    wchar_t warr[2];
    std::setlocale(LC_ALL, "en_US.utf8");
 
    char input[] = "25 54.32E-1 Thompson 56789 0123 56ß水";
    // parse as follows:
    // %d: an integer 
    // %f: a floating-point value
    // %9s: a string of at most 9 non-whitespace characters
    // %2d: two-digit integer (digits 5 and 6)
    // %f: a floating-point value (digits 7, 8, 9)
    // %*d an integer which isn't stored anywhere
    // ' ': all consecutive whitespace
    // %3[0-9]: a string of at most 3 digits (digits 5 and 6)
    // %2lc: two wide characters, using multibyte to wide conversion
    const int ret = std::sscanf(input, "%d%f%9s%2d%f%*d %3[0-9]%2lc",
                                &i, &x, str1, &j, &y, str2, warr);
 
    std::cout << "Converted " << ret << " fields:\n"
                 "i = " << i << "\n"
                 "x = " << x << "\n"
                 "str1 = " << str1 << "\n"
                 "j = " << j << "\n"
                 "y = " << y << "\n"
                 "str2 = " << str2 << std::hex << "\n"
                 "warr[0] = U+" << (int)warr[0] << "\n"
                 "warr[1] = U+" << (int)warr[1] << '\n';
}

出力

Converted 7 fields:
i = 25
x = 5.432
str1 = Thompson
j = 56
y = 789
str2 = 56
warr[0] = U+df
warr[1] = U+6c34

[編集] 関連項目

(C++11)(C++11)(C++11)
stdin、ファイルストリーム、またはバッファから書式付き入力を読み取ります。
可変長引数リストを使用する
(関数) [編集]
ファイルストリームから文字列を取得する
(関数) [編集]
stdout、ファイルストリーム、またはバッファにフォーマットされた出力を書き込む
(関数) [編集]
文字シーケンスを整数値または浮動小数点数値に変換する
(関数) [編集]
C ドキュメントscanffscanfsscanf
English 日本語 中文(简体) 中文(繁體)