スターリング数 全射

スターリング数について理解するため、次の問題を考えます。

Example 3.1

出席番号0から5までの6人が区別のつかない4台のタクシーに分乗する場合、考えられる組合せは何通りになりますか。なお、各タクシーには少なくとも1人は乗るものとします。

第1章では学生を部屋へ割り当てることを例に取り、重複順列について検討しました。一方、この章では相異なる部屋を区別のつかないタクシーに置き換え、どの学生のグループ分けだけに注目します。

全射の重複順列からスターリング数に対応する集合分割を生成

写像から見たスターリング数と集合分割

重複順列は定義域の集合Nから値域の集合Kとも相異なる写像になります。重複組合せは集合Nの要素が区別されない、増加写像の考え方を使い、集合Kの要素が昇順になるような組合せに絞り込みました。これに対し、スターリング数は、相異なる集合Nから、区別のつかない集合Kへの写像になります。このため、集合Nの要素が昇順になるような組合せに絞り込むことが必要となります。

Figure 3.1 重複順列と重複組合せと集合分割との相違
重複順列と重複組合せと集合分割との相違

重複順列の例を挙げるとFigure 3.2のようになります。

Figure 3.2 集合Kを基準に集合分割を整理
集合Kを基準に集合分割を整理

2つの重複順列は別のものとして数えますが、集合Kを区別のつかない構造に変換するとA, B, C, Dの区別がなくなるので、(0, 1), (2,3), (4), (5)の組合せで区別されないタクシーに乗るので1通りとして数えます。このような対応は集合の分野では集合{0,1,2,3,4,5}を{0,1}(2,3),{4},{5}のように次の条件を満たす部分集合に分割することになります。

集合 Xの分割とは、次の条件を満たすような部分集合の集まり$\{A_1, A_2, \ldots, A_k\}$をいいます

① 被覆性(covering)

各部分集合を合わせると元の集合 X になる。

$A_1 \cup A_2 \cup \cdots \cup A_k = X $

②互いに素(mutually disjoint)

各部分集合は重なりを持たない。

$ A_i \cap A_j = \emptyset \quad (\text{for } i \ne j)$

③空でない集合

$A_i \ne \emptyset \quad (\forall i)$

このような対応の組合せの数はスターリング数(stirling number)と呼ばれ、これにもとづく組合せはスターリング数に対応する集合分割(set partition)といいます。なお、今後は簡便のため集合分割と呼ぶことにします。

とはいえ、それらを同じ集合分割として捉えるのは容易ではありません。そこで、視点を変え、A, B, C, Dの4つのタクシーにだれが乗るか、という視点でリストを変換するinverse_value_mapping関数を作成します。Figure 3.3で示すように、新たなリストnew_elmにk_listの要素の数だけ各タクシーに対応する空のリストを初期化し、A→0、B→1、C→2、D→3という対応にして、リストの添え字にします。そして、それぞれの重複順列の要素について、例えば出席番号2の学生がAの車に乗るとしたら、new_elm[0]に2を追加します。こうすることにより、どのタクシーにどの学生の組合せが乗るのかが明らかになります。

次に、増加関数の考え方を使い昇順に並んでいるものに絞り込みます。これについては以前作成したfilter_increasing_map関数を使用します。

Figure 3.3 集合Kについて区別されない構造に変換
集合Kについて区別されない構造に変換

右側の配列にすると、重複組合せに対し集合Kについて区別されない構造に変換すると全て同じ組合せになります。k=4なので第2階層の要素数4のタプルについての順列、$k!=4!=24$個が1つに集約されることがわかります。

区別されない全射の重複順列の生成

全射の重複順列はp90111で作成したgenerate_surjective_perm関数を使い、全射の重複順列から抜き出したリストsurjective_perm_listを生成します。このため、関数の実行に当たりgenerate_surjective_perm関数を使い一度実行しておく必要があります。

Code 3.1 全射の重複組合せを生成

  1. k_list = ['A', 'B', 'C', 'D']
  2. k = len(k_list)
  3. n = 6
  4. surjective_perm_list = generate_surjective_perm(k_list, n)
  5. print(
  6. f'generate_surjective_perm({len(k_list)}, {n}) = '
  7. f'{len(surjective_perm_list)}'
  8. )
  9. surjective_perm_list
generate_surjective_perm(4, 6) = 1560
[('A', 'A', 'A', 'B', 'C', 'D'),
 ('A', 'A', 'A', 'B', 'D', 'C'),
 ('A', 'A', 'A', 'C', 'B', 'D'),
 ('A', 'A', 'A', 'C', 'D', 'B'),
・
('A', 'A', 'B', 'B', 'D', 'C'),
・
('B', 'B', 'A', 'A', 'D', 'C'),
・
('D', 'D', 'D', 'B', 'C', 'A'),
 ('D', 'D', 'D', 'C', 'A', 'B'),
 ('D', 'D', 'D', 'C', 'B', 'A')]

1. 実例に副ってプログラムを作成し実行するため、集合Kをリストk_list=['A', 'B', 'C', 'D']と定義し、今後、要素数を計算に使うことも多いのでkにはkリストの要素数、4を代入します。

2. 生成した全射の重複順列を出力しますが、1560通りと膨大な数になるので一部の表示に留めます。

全射の重複順列は、前章で次のような包除原理を使った計算式で求めることができます。

Equation 3.1 包除原理を使った全射の重複順列の個数

$PIE(n, k)=\sum\limits_{i=0}^{k}(-1)^i\,{}_kC_i(k-i)^n$

さっそく、第1章で作成したcalc_surjective_perm関数を使い全射の重複順列の数を計算します。

Code 3.2 重複順列の全射の公式を使って個数を計算(再掲)

  1. print(
  2. f'calc_surjective_perm({len(k_list)}, {n}) = '
  3. f'{calc_surjective_perm(n, len(k_list))}'
  4. )
count_surjective_perm(4, 6) =  1560

7. Code 3.1と比較するため、k = 4、n = 6を引数として渡します。

Code 3.1で得られた1560通りという結果と一致していることが確認できました。

重複順列を集合Nについて区別されない構造に変換

全射の重複順列を生成する

全射の重複順列では集合Kを基準に増加関数の考え方を適用するのが困難なので、視点を変えて、どのタクシーにどの学生が乗るかを示す集合分割を生成する関数を作成します。関数名は値の配列を逆にするという意味でinverse_value_mapping関数と命名し生成するリストをinverse_value_mapping_listとします。inverse_value_mapping_listの中の1つの重複順列をnew_elmとし、k_listの要素数のタプルで構成されます。perm_listから読み込んだ要素itemの集合Kでの順序を示す値をインデックスとしてnew_elmの該当するタプルに追加します。この際、リストk_listにindexメソッドを適用します。例えばk_list = ['A', 'B', 'C', 'D']に対して、k_list.index(‘C’)に対して‘C’のk_listにおけるインデックス(0から始まる順序)を返します。

Code 3.3 集合Kの要素を基準に重複順列を整理

  1. def inverse_value_mapping(k_list, perm_list):
  2. converted_list = []
  3. for elm in perm_list:
  4. new_elm = [() for _ in range(len(k_list))]
  5. for num, item in enumerate(elm):
  6. new_elm[k_list.index(item)] += (num,)
  7. converted_list.append(tuple(new_elm))
  8. return converted_list
  9. inverse_value_list = inverse_value_mapping(
  10. k_list,
  11. surjective_perm_list
  12. )
  13. print(f'inverse_value_list = {len(inverse_value_list)}')
  14. inverse_value_list
calc_surjective_perm(4, 6) = 1560
[((0, 1, 2), (3,), (4,), (5,)),
 ((0, 1, 2), (3,), (5,), (4,)),
 ((0, 1, 2), (4,), (3,), (5,)),
 ((0, 1, 2), (5,), (3,), (4,)),
・
((0, 1), (2, 3), (4,), (5,)),
・
((2, 3), (0, 1), (5,), (4,)),
・
((5,), (4,), (3,), (0, 1, 2))]

4. new_elmで、AからDの4台のタクシーに誰が乗るかを表す組合せの1つを集計します。このため、k_listの数k=4の空のリストをあらかじめ定義しておきます。初期化をするだけなのでインデックスは必要ないので”for _ in”とします。

6. 例えば、permの要素であるitemのk_listにおける添え字をnew_elmの該当するタプルに追加します。

配列を並べ替えただけなので、まだ、この段階では件数は1560件と変わりません。

単調増加写像の考え方で集合Kを区別のつかない集合分割に変換

集合Kについて増加写像の考え方を使いラベルなしの構造に変換するため、p90120作成したfilter_increasing_map関数を適用します。このことにより( (0, 1), (2, 3), (4), (5))、((0, 1), (2, 3), (5) , (4))、((2, 3), (0, 1), (4), (5))などは、昇順に並んでいる((0, 1), (2, 3), (4), (5))に代表させることにより、ラベルなしの分割に集約することができます。

Code 3.4 増加関数の考え方を使い集合Kをラベルなしの構造に変換

  1. indist_partitions_list = filter_increasing_map(inverse_value_list)
  2. print(f'indist_partitions_list = {len(indist_partitions_list)}')
  3. indist_partitions_list
indist_partitions_list = 65
[((0, 1, 2), (3,), (4,), (5,)),
 ((0, 1, 3), (2,), (4,), (5,)),
 ((0, 1), (2, 3), (4,), (5,)),
 ((0, 1, 4), (2,), (3,), (5,)),
 ((0, 1), (2, 4), (3,), (5,)),
 ((0, 1), (2,), (3, 4), (5,)),
 ((0, 1, 5), (2,), (3,), (4,)),
 
・
・
((0,), (1, 5), (2,), (3, 4)),
 ((0,), (1,), (2, 5), (3, 4)),
 ((0,), (1,), (2,), (3, 4, 5))]

5. 変換された重複順列を1つずつelmとして読みこみ、要素の1番目と2番目、2番目と3番目・・というように次々と大きさを比べます。このとき、後の要素の方が小さい場合は増加写像の要件を満たさなくなるので、対象外となり6.でbreakします。

7. 5~6.に一度もあてはまらずループを抜けたものは増加写像となるので、surjective_listに追加します。

n=4,k=6のスターリング数は、包除原理により求めた全射の重複順列の1560通りをn!=4!=24で割った65通りに絞られました。

スターリング数を計算する関数

前節での検討が正しいかをSymPyライブラリの関数を使い確認し、スターリング数の個数を計算する関数と、集合分割を生成する関数を作成します。

SymPyライブラリのstirling関数を使いスターリング数を計算する

スターリング数の計算にはSymPyライブラリのsympy.functions.combinatorial.numbersモジュールで提供される stirling関数を使用します。stirling関数は集合Nの個数nと集合Kの個数kを引数とします。

Code 3.5 SymPyライブラリのstirling関数によるスターリング数の計算

  1. from sympy.functions.combinatorial.numbers import stirling
  2. print(
  3. f'sympy_stirling({n}, {len(k_list)}) = '
  4. f'{stirling(n, len(k_list))}'
  5. )
sympy_stirling(6, 4) =  65

2. 前節での結果と比べるため、n=6,k=4を引数とします。

65通りとなりとCode 3.4で導いた結果と一致していることがわかりました。

包除原理を使いスターリング数を計算する関数を作成

スターリング数の計算式

スターリング数は、大文字のSを使いS(n, k)とあらわします。これまでは${}_kC_n$のようにitertools.combinations(k_list, n)のようにk,nの順序で引数を設定していましたが、これからは、慣例的にS(n ,k)のようにn, kと順序が逆転します。

スターリング数は包除原理による全射の重複順列の計算式に変更を加えることにより導くことができます。計算式で、kの値ごとに重複順列の個数を計算し加減するところで、ラベルなしの個数にするためk!で割る処理を加えます。

Equation 3.2 スターリング数の計算

$S(n, k)=\sum\limits_{i=0}^{k}(-1)^i\,{}_kC_i(k-i)^n/k!$

スターリング数を計算する関数

スターリング数を計算する関数を作成します。関数名は文字通りcalc_stirling_countとします。なお、組合せはcomb関数、階乗はfactorial関数を使用するのでimportあらかじめインポートしておく必要があります。

Code 3.6 スターリング数を計算する関数

  1. def calc_stirling_num(n, k):
  2. sigma = 0
  3. for i in range(k + 1):
  4. sigma += ((-1)**i) * comb(k, i) * (k - i)**n
  5. return int(sigma / factorial(k))
  6. print(
  7. f'calc_stirling_num({n}, {len(k_list)}) = '
  8. f'{calc_stirling_num(n, len(k_list))}'
  9. )
calc_stirling_num(6, 4) =  65

7.  perm_surjective_counと同じ包除原理を使い、全射の重複順列の個数を計算し、戻り値を返すときに、$k!$で割ります。割り算の結果は小数点型になるので、int関数で整数に変換します。

8.  Code 3.4の結果と比べるため、n=6,k=4を引数とします。

集合分割を生成する関数

SymPyライブラリのmultiset_partitions関数を使い集合分割を生成

集合分割には、SymPyライブラリのsympy.utilities.iterablesモジュールで提供されるmultiset_partitions関数を使用します。引数としてn,,kを渡しますが、nは集合Nの要素をリストでも個数でも可能です。前節に作成した集合分割と一致するか確認します。multiset_partitionsは集合を指定した数に分割するものですが、集合に同じ値の要素があることも許されます。このため、集合分割は多重分割の特殊なケースと考えられます。

Code 3.7 SymPyライブラリのmultiset_partitionsによる集合分割の生成

  1. from sympy.utilities.iterables import multiset_partitions
  2. sympy_partitions_list = list(multiset_partitions(n, len(k_items)))
  3. len(sympy_partitions_list)
65

2. 前節での結果と比べるため、n=6,k=4を引数とします。

生成されるリストは、これまでよりも階層が1つ多く3階層となっています。これは、集合分割なので1つの写像を表現するのに2階層必要になるためです。また、第2階層以下もタプルではなくリストになっていますが、これはSymPyライブラリが提供する関数は、リストで生成する仕様となっているためです。

生成した集合分割とSymPyライブラリの計算結果を比較

集合分割を比較するためリストの形式を変換

重複組合せをラベルがない構造に変換すると、全て同じ組合せになることがわかります。k=4 なので、第2階層の要素数 4 のタプルについての順列k!=4!=24通りが1つに集約されることがわかります。

順列や組合せを生成する関数では、itertoolsモジュールに合わせて第1階層はリスト、第2階層以降にはタプルとなっている、自作関数においてもそれに合わせています。一方、SymPyライブラリで生成される組合せはすべてリストとして出力されるため、両者が一致しているかを確認するには、形式を変換する必要があります。

そこで、最上位の階層はリスト、第2階層以下をすべてタプルに変換する関数を定義します。関数名はconvert_to_tupleとし、ネスト構造の深さに応じて再帰的に処理することで、任意の深さの構造に対応できるようにしています。

Code 3.8 リストをタプルに変換する

  1. def convert_to_tuple(sequence, output='tuple', depth=1):
  2. if isinstance(sequence, (list, tuple)):
  3. temp_list = [convert_to_tuple(item, output, depth + 1)
  4. for item in sequence]
  5. if output == 'list':
  6. return list(temp_list)
  7. else:
  8. if depth == 1:
  9. return list(temp_list)
  10. else:
  11. return tuple(temp_list)
  12. else:
  13. return sequence
  14. print(convert_to_tuple([[1, 2], [[2], [3, 4]], [3]]))
  15. print(convert_to_tuple(((1, 2), ((2,), (3, 4)), (3,))))
  16. print(convert_to_tuple(([1, 2], [(2,), (3, 4)], (3,))))
  17. print(convert_to_tuple([[1, 2], [[2], [3, 4]], [3]],'list'))
  18. print(convert_to_tuple(((1, 2), ((2,), (3, 4)), (3,)),'list'))
  19. print(convert_to_tuple(([1, 2], [(2,), (3, 4)], (3,)),'list'))
[(1, 2), ((2,), (3, 4)), (3,)]
[(1, 2), ((2,), (3, 4)), (3,)]
[(1, 2), ((2,), (3, 4)), (3,)]

4. 引数 sequence がリストまたはタプルである場合、その中の各要素に対して再帰的にconvert_to_tuple を適用します。その際、現在の深さ depth を1だけ増やすことで、ネスト構造の深さを追跡します。

5. 再帰処理の結果を temp_list に格納し、最上位階層(depth == 1)であればリストとしてそのまま返します。それ以外の深さ(第2階層以下)では、結果をタプルに変換して返します。

6. この処理により、最上位の構造はリスト、それ以外のすべての入れ子構造はタプルに変換されます。

7. 一方、引数 sequence がリストでもタプルでもない(たとえば整数や文字列などの)通常の値である場合は、それ以上分解する必要がないため、その値をそのまま返します。

前節で生成した集合分割をSymPyライブラリによる結果と比較する

さっそく、SymPyで作成したsympy_multiset_partitions_listと比較します。

Code 3.9 ライブラリの関数と比較

  1. if convert_to_tuple(sympy_multiset_partitions_list) == unlabeled_partitions_list:
  2. print('sympy_multiset_partitions_list == unlabeled_partitions_list')
sympy_multiset_partitions_list == unlabeled_partitions_list

2. 第1階層の各リストについて、タプルに変換します。

multiset_partmultiset_partitions関数で生成したsympy_multiset_partitions_listは、convert_to_tuple関数を使用してunlabeled_partitions_listと同じ形式に変換します。

集合分割を比べます。Code 3.8の計算結果が正しいことを確認することができました。次の節では、スターリング数を簡単に計算する漸化式を作成し、これをもとに集合分割を生成する方法を考えます。