7/09/2024

Excel。REGEXEXTRACT関数は、パターンに一致する文字を抽出する新しい関数です【REGEXEXTRACT】

Excel。REGEXEXTRACT関数は、パターンに一致する文字を抽出する新しい関数です

<REGEXEXTRACT関数>

Micorosoft365 Insider版 に新しく追加された「REGEXEXTRACT関数」をとりあえずつかってみました。


なんでも、指定された正規表現に基づいて文字列から文字列を抽出する関数だそうです。

引数は、

REGEXEXTRACT(text,pattern,[return_mode],[case_sensitivity])


次のようなデータを用意しました。

REGEXEXTRACT関数

A2にサンプル文書が入力されています。このサンプル文書内にある、英単語のみを抽出したいのですが、どのようにしたらいいのでしょうか。


そこで、REGEXEXTRACT関数の登場というわけです。

では、C1にREGEXEXTRACT関数をつかって数式を設定します。

=REGEXEXTRACT(A2,"[A-z]+",1)


すると、英単語を抽出することができました。

REGEXEXTRACT関数

たしかに、A2には、Keyword と Word しかありません。

数式は、スピル機能によって、オートフィルで数式をコピーする必要はありません。


引数の説明です。


最初の引数。「text」 文字列を選択しますので、A2 


2番目の引数。「pattern」 抽出するパターンを記述する正規表現(regex)です。


正規表現パターンには、トークンと呼ばれるシンボルを使用します。

今回は、英単語だったので、

“[A-z]+”

と設定しました。


この意味は、1つ以上のA-zの範囲の文字 となります。


3番目の引数は、「return_mode」。

省略可能です。

1は、パターンに一致するすべての文字列を抽出します。


4番目の引数は、[case_sensitivity]。

省略可能です。

既定は0の「大文字と小文字の区別」をします。


アイディアによって、使えそうな関数ですが、2番目の引数のpattern の設定をどのようにしたらいいのかが、悩みどころかなと。


今回紹介した、REGEXEXTRACT関数以外にも、

REGEXTEST関数 とREGEXREPLACE関数も追加されました。


なお、Microsoft365 Insider版に追加された関数です。正規表現については、今後変更があるようです。