正規表現がわからなさすぎて挫けそうなのでブログにしてみます。
まずは、reモジュールをインポートする。
import re
区切り文字が同じ意味で複数種類あるのをsplitする場合は、こんな書き方をして、リストで返ってくる。
\s* は0個以上のストリングがあること。これがあると、前後の空白と区切り文字をまとめて一つの区切りとして扱ってくれるので、表記ゆれの解消に使える。
re.split('\s*[いろんな区切り文字]+\s*', 対象のストリング)
正規表現って出来るようになると面白そうだけど、記号の種類が多すぎてついていけない。