Choisir un encodage CNF de contraintes de cardinalité performant pour SAT

                                                   T. Delacroix
                                    IMT Atlantique - Dépt. LUSSI, Brest, France
                                       thomas.delacroix@imt-atlantique.fr


Résumé                                                           veur et à la fois de la façon dont la contrainte est exprimée
                                                                 sous forme CNF.
Cet article répond à une double problématique : (1) com-
ment choisir un encodage CNF pour des contraintes de             De nombreux travaux se sont donc penchés sur la ques-
cardinalité de type #k(x1 , ..., xn ) où # peut être l’un des    tion de savoir comment exprimer des contraintes classiques
symboles ≤, =, ≥ ; (2) déterminer un encodage CNF per-           des CSP sous forme CNF de manière performante pour les
formant pour les contraintes de cardinalité plus générales       solveurs CNF-SAT [1, 2, 3, 4, 5, 7, 10, 14, 15]. C’est le
∈ K(x1 , ..., xn ) où K ⊂ J0, nK. Pour ce faire, on intro-       cas notamment pour les contraintes de cardinalité 1 de type
duit d’abord un nouvel encodage séquentiel bidirectionnel.       #k(x1 , ..., xn ) où # peut être l’un des symboles ≤, =, ≥.
On décrit alors un processus pour choisir l’encodage le          En effet, un encodage naïf de ces contraintes contient, dès
plus performant pour une contrainte de cardinalité donnée        que n augmente, beaucoup trop de clauses pour pouvoir
s’appuyant sur une comparaison de différents encodages           être utilisé de manière raisonnable en pratique. De nom-
pour tous les cas possibles de valeurs n et k. Enfin, on         breux encodages CNF ont donc été proposés, fonctionnant
montre que l’encodage séquentiel bidirectionnel permet de        tous sur le même principe général : des variables supplé-
répondre à la problématique (2).                                 mentaires sont introduites de manière à réduire drastique-
                                                                 ment le nombre de clauses.
Mots Clef
                                                                 Parmi les travaux existants, on trouve des comparaisons
CNF, SAT, encodage, contraintes de cardinalité.                  des différents encodages proposés [2, 9, 12]. Toutefois,
                                                                 ces comparaisons ne sont pas exhaustives. En effet, l’ac-
Abstract                                                         cent y est généralement mis sur le comportement des en-
This article has a double aim : (1) define a process for         codages lorsque n tend vers l’infini. Or, en pratique, on
choosing the most efficient CNF encoding for cardinality         peut également être amené à considérer de très nombreuses
constraints of type #k(x1 , ..., xn ) where # is one of the      contraintes de cardinalité de faible dimension. Une compa-
following symbols ≤, =, ≥ ; (2) determine an efficient CNF       raison exhaustive des encodages existants s’impose donc
encoding for the more general cardinality constraints of         afin d’essayer d’optimiser au maximum l’étape du choix de
type ∈ K(x1 , ..., xn ) where K ⊂ J0, nK. In order to do this,   l’encodage dans la résolution SAT et cela constitue un des
we introduce a new sequential bidirectional encoding. We         éléments central de cet article. On s’aperçoit alors qu’il n’y
then describe a process for choosing the most efficient en-      a pas un encodage plus performant que tous les autres mais
coding for a given cardinality constraint based on a com-        de nombreux encodages performants selon les paramètres
parison of different encodings for all possible values of n      du problème. On montre également qu’il est possible de
and k. Finally, we show that the sequential bidirectional        combiner des encodages pour obtenir de meilleures perfor-
encoding can be used to reach our second aim.                    mances.

Keywords                                                         Par ailleurs, on introduit dans cet article un nouvel enco-
                                                                 dage : l’encodage séquentiel bidirectionnel. Cet encodage,
CNF, SAT, encoding, cardinality constraints.                     dont la définition est assez naturelle, est particulièrement
                                                                 adapté pour considérer des contraintes de cardinalité plus
1    Introduction                                                complexes, notamment les contraintes de cardinalité cor-
Parmi les solveurs modernes en programmation sous                respondant à un intervalle. On montre par ailleurs qu’il
contrainte les plus performants, on trouve aujourd’hui un        permet de considérer des contraintes de cardinalité de type
certain nombre de solveurs CNF-SAT. Les palmarès ré-             ∈ K(x1 , ..., xn ) où K ⊂ J0, nK de manière performante ce
cents du MiniZinc Challenge en témoignent [13, 11].              qui représente une nouveauté.
Un solveur CNF-SAT permet d’obtenir une valuation pour
laquelle une expression logique sous forme conjonctive
                                                                     1. Le terme contrainte de cardinalité est utilisé ici selon la nomen-
normale (CNF) donnée est satisfaite lorsqu’il en existe une.     clature standard dans le contexte SAT et ne doit pas être confondu avec
Pour une contrainte particulière, la performance du solveur      d’autres notions telles que celle de global cardinality constraint utilisée
dépend donc à la fois de l’algorithme de résolution du sol-      dans le contexte de la programmation sous contrainte.
2      Encodage séquentiel bidirectionnel                                                                   n
                                                                    rajout de ces deux clauses. On note SeqB≤k       n
                                                                                                               , SeqB≥k et
                                                                          n
                                                                    SeqB=k les encodages respectifs correspondants.
Dans la suite, on considère des entiers n et k tels que n ≥ 2
et k ∈ J1, n − 1K, les autres cas étant évidemment triviaux.
La démarche qui mène à définir l’encodage proposé dans
                                                                    3     Choisir son encodage
cette section s’apparente à la démarche qui mène à l’en-            3.1    Comparaisons des encodages
codage séquentiel proposé par Carsten Sinz dans [12]. En            En plus des encodages décrits précédemment, on va égale-
effet, dans l’article
               Pi précité, l’auteur définit les sommes par-                                            n
                                                                    ment considérer l’encodage naïf (N≤k ) défini par :
tielles si =      m=1 xm et considère le j-ième bit si,j de
la représentation unaire de si . Il transpose alors ces bits               ^    k+1
                                                                                _
                                                                                                                             n
en variable booléenne dans un encodage CNF pour abou-                                  ¬xij                                (N≤k )
tir à l’encodage ci-dessous pour la contrainte de cardinalité                k+1 j=1
                                                                          i∈Cn
≤ k(x1 , ..., xn ). Par la suite, on le désigne par le nom d’en-
codage séquentiel unidirectionnel et on le note SeqU≤k     n
                                                             .      où i = (i1 , ..., ik+1 ) est une combinaison appartenant
                                                                    à l’ensemble Cnk+1 des combinaisons de k + 1 éléments
                                                                    de J1, nK. On rajoute l’encodage proposé par Bailleux &
                                                                                              n
       (¬x1 ∨ s1,1 )                                                Boufkhad dans [3] (BB≥k     1 ,≤k2
                                                                                                       ). On note que les auteurs
       (¬s1,j )      ∀j ∈K1, kK                                     précités ne donnent pas d’expression explicite de leur en-
                                                                    codage mais décrivent plutôt un algorithme permettant de
                                             
       (¬xi ∨ si,1 )                         
                                                                    le construire.
                                             
       (¬si−1,1 ∨ si,1 )
                                             
                                             
                                             
       (¬xi ∨ ¬si−1,j−1 ∨ si,j )
                                 
                                               ∀i ∈K1, nJ           D’autres encodages de la littérature [15] ne sont pas consi-
                                   ∀j ∈K1, kK                      dérés car ils ne satisfont pas la condition de performance
       (¬si−1,j ∨ si,j )                     
                                             
                                                                    relative à la propagation unitaire décrite initalement dans
                                             
       (¬xi ∨ ¬si−1,k )
                                             
       (¬xn ∨ ¬sn−1,k )                                             [3] (i.e. il ne permettent pas de vérifier la contrainte sur
                                                       n            une valuation partielle des variables xi ).
                                                (SeqU≤k   )
                                                                    Par ailleurs, par manque de temps, nous n’avons pas in-
Cependant, cette transposition contient une réduction qui           tégré ici d’encodage à base de réseaux [1, 2, 7]. En ef-
aboutit à une perte d’information entre la variable si,j tel        fet, nous souhaitons d’abord vérifier que la génération de
qu’elle est encodée dans SeqU≤k    n
                                      par rapport au bit si,j dé-   tels encodages est bien linéaire en leur nombre total de
crit précédemment. En effet, le bit si,j est équivalent à si ≥      clauses (ou de littéraux), de manière à ce que la compa-
j. Or l’encodage SeqU≤k     n
                               donne (si ≥ j) =⇒ si,j mais          raison soit valable. Ce travail reste donc à compléter sur
pas l’implication réciproque. Cette perte d’information est         ce point. En effet, de tels encodages peuvent comporter
volontaire car elle entraine un encodage plus restreint de          un nombre total de clauses inférieur à ceux des encodages
la contrainte ≤ k(x1 , ..., xn ). Toutefois, ce choix n’est pas     considérés ici pour un certain nombre de valeurs de n et k.
forcément judicieux lorsque l’on considère une contrainte           Ceci est notamment le cas de l’encodage de la contrainte
= k(x1 , ..., xn ) ou deux contraintes ≥ k1 (x1 , ..., xn ) et      ≤ k(x1 , ..., xn ) proposé par Asín et al. dans [2] dont le
≤ k2 (x1 , ..., xn ) définissant un intervalle.                     nombre total de clauses est égal à :
L’encodage CNF qui suit permet d’encoder exactement                         3            3               3
l’ensemble des équivalences (si ≥ j) ⇐⇒ si,j pour tout              −3m+6mK+ mK log2 (K)+ mK log2 (K)−3K− K log2 (K)
                                                                            4            4               2
i ∈ J1, nK et pour tout j ∈ J1, k + 1K. On appelle enco-
                                                                    avec K = 2dlog2 (k)e et m =
                                                                                                  n
dage séquentiel bidirectionnel cet encodage et on le note
       n                                                                                           K .
SeqB#k    .
                                                                    Le tableau 1 donne le nombres de clauses (avec le détail en
    (x1 ∨ ¬s1,1 )                                                   fonction de la taille en nombre de littéraux de ces clauses)
    (¬xi ∨ si,1 ) ∀i ∈ J1, nK                                       ainsi que le nombre de variables auxilaires pour chacun de
    (¬sj−1,j ) ∀j ∈K1, k +   1K                                    ces encodages. Les valeurs figurant dans ce tableau ont été
                                                                    recalculées à partir des descriptions de ces encodages dans
                                               
    (¬si−1,j ∨ si,j )
                                ∀j ∈ J1, k + 1K
                                               
    (xi ∨ si−1,j ∨ ¬si,j )
                                                                   les articles précités [12, 3] ainsi que le présent article.
                                                ∀i ∈K1, nK
    (si−1,j−1 ∨ ¬si,j )
                                ∀j ∈K1, k + 1K 
                                               
    (¬xi ∨ ¬si−1,j−1 ∨ si,j )
                                                                   Dans la suite de cet article, on utilise les informations
                                                       n
                                                                    de ce tableau pour permettre de choisir l’encodage le
                                                 (SeqB#k  )         mieux adapté aux différents cas étudiés. On fera également
                                                                    usage de la règle suivante pour obtenir un encodage d’une
À partir de cet encodage, il est très facile d’obtenir la           contrainte ≥ k(x1 , ..., xn ) en considérant l’encodage pour
contrainte de cardinalité ≤ k(x1 , ..., xn ). En effet, il suf-     la contrainte ≤ k(x1 , ..., xn ) via l’utilisation de la règle
fit de rajouter la clause ¬sn,k+1 . De même, la contrainte ≥        suivante :
k(x1 , ..., xn ) s’obtient simplement par le rajout de la clause
sn,k . Enfin, la contrainte = k(x1 , ..., xn ) s’obtient par le           ≥ k(x1 , ..., xn ) ⇐⇒ ≤ (n − k)(¬x1 , ..., ¬xn )    (1)
De même, on pourra obtenir un encodage de la contrainte                      On remarque d’abord que pour une telle contrainte, l’en-
                                                                                             n
= k(x1 , ..., xn ) en combinant différents encodages via                     codage SeqU≤k       est clairement toujours plus performant
                                                                                                       n
l’utilisation de la constation suivante :                                    que l’encodage SeqB≤k         donc on peut exclure ce der-
                                                                             nier de notre comparaison. Par contre, en utilisant (1),
                                                                                                                        n
= k(x1 , ..., xn ) ⇐⇒ (≤ k(x1 , ..., xn )∧ ≥ k(x1 , ..., xn ))               on peut considérer l’encodage SeqB≥n−k             appliqué à
                                                                                                              ¬n
                                                                       (2)   (¬x1 , ..., ¬xn ). On note SeqB≥n−k cet encodage.
                                                                                                                              n         n
                                                                             On cherche donc à comparer les encodages N≤k        , SeqU≤k  ,
                                                                                   ¬n            n
                                                                             SeqB≥n−k , BB≥0,≤k . Une analyse complète des diffé-
                                Nombre de                      Nombre de     rents nombres totaux de clauses pour chacun de ces enco-
   Encodage                 clauses composées                   variables    dages permet de déterminer l’encodage offrant le plus petit
                              de m littéraux                   auxiliaires   nombre de clauses en fonction de n et k. On a réalisé cette
                      m=1                 k−1
                                                                             analyse ici et regroupé les résultats dans le tableau 2. Ce ta-
          n           m=2          nk + 2n − 2k − 2
      SeqU≤k                                                     nk − k      bleau décrit, en fin de compte, une partition de l’ensemble
                      m=3           nk − n − 2k + 2
                      Total        2nk + n − 3k − 1                          des valeurs potentielles de n et k en 4 parties, chacune cor-
                      m=1                    k                               respondant aux valeurs de n et k pour lesquelles l’enco-
          n
      SeqB#k
                      m=2            2nk + 2n − 2k                           dage en colonne est optimal (pour le critère du nombre de
                                                                 nk + n
                      m=3          2nk + n − 2k − 1                          clauses considéré ici).
                      Total       4nk + 3n − 3k − 1
        n                                    n 
       N≤k           m=k+1                 k+1
                                                                   0                       Conditions sur n et k par encodage
                      m=1             n − k2 + k1                                        n
                                                                                     SeqU≤k        n
                                                                                              BB≥0,≤k                ¬n
                                                                                                              SeqB≥n−k         n
                                                                                                                              N≤k
                                    n2 + 2n log2 (n)
   n        2         m=3                                                                                 n ≤ 5 et k ∈
 BB≥k1 ,≤k2
                                         +n − 2                n log2 (n)
                                    n2 + 2n log2 (n)                                     ∅            ∅                  ∅       J1, nJ
                      Total
                                  +2n − k2 + k1 − 2                                                   6 ≤ n ≤ 7 et k ∈
                                                                                      J1, k1 J         ∅             ∅           Jk1 , nJ
                                                                                     où k1 = n − 3.
TABLE 1 – Nombre et tailles de clauses pour chaque enco-
                                                                                                    8 ≤ n ≤ 10 et k ∈
dage considéré
                                                                                      J1, k1 J        ∅            ∅             Jk1 , nJ
                                                                                     où k1 = n − 2.
3.2     Contrainte ≤ k(x1 , ..., xn )                                                              11 ≤ n ≤ 27 et k ∈
                                                                                      J1, k2 J       ∅         Jk2 , k1 J m      Jk1 , nJ
Dans cette secion, on compare différents encodages de ≤                                                   l
                                                                                                                10n2 −3n−3
                                                                                     où k1 = n − 2 et k2 =        3(5n−6)
                                                                                                                             .
k(x1 , ..., xn ).
                                                                                                   28 ≤ n ≤ 148 et k ∈
               Conditions sur n et k par encodage                                     J1, k2 J        ∅        Jk2 , k1 J m      Jk1 , nJ
                                                                                                                10n2 −3n−3
                                                                                                           l
             n
         SeqU≤k        n
                  BB≥0,≤k                ¬n
                                  SeqB≥n−k         n
                                                  N≤k                                où k1 = n − 1 et k2 =                   .
                                                                                                                  3(5n−6)
                               n ≤ 5 et k ∈                                                          149 ≤ n et k ∈
               ∅           ∅                  ∅       J1, nJ                          J1, k3 J   Jk3 , k2 J      Jk , k J     Jk1 , nJ
                                                                                                            l 2 2 1                m
                                                                                                             7n −6n log2 (n)−6n+4
                        6 ≤ n ≤ 8 et k ∈                                             où k1 = n − 1, k2 =           10(n−1)
          J1, k1 J       ∅             ∅              Jk1 , nJ
                                                                                             l 2                    m
                                                                                              3n +6n log2 (n)+3n−7
                                                                                     et k3 =           5n−8
                                                                                                                      .
         où k1 = n − 4.
                        9 ≤ n ≤ 13 et k ∈
                                                                             TABLE 3 – Encodage de ≤ k(x1 , ..., xn ) donnant le
          J1, k1 J        ∅            ∅              Jk1 , nJ
         où k1 = n − 3.
                                                                             nombre total minimal de littéraux en fonction de n et k
                      14 ≤ n ≤ 30 et k ∈
          J1, k2 J       ∅          Jk2 , k1 J        Jk1 , nJ
                                                                             Le tableau 2 permet de choisir un encodage en fonction du
         où k1 = n − 3 et k2 = 23 (n + 1) .
                                                                           nombre de clauses de cet encodage mais il ne prend pas
                      31 ≤ n ≤ 36 et k ∈
                                                                             en compte la taille de ces clauses (i.e. le nombre de litté-
          J1, k2 J       ∅          Jk2 , k1 J        Jk1 , nJ               raux par clause). Or la taille des clauses dans une contrainte
         où k1 = n − 2 et k2 = 23 (n + 1) .
                                                                           CNF peut avoir une influence importante sur la rapidité
                          37 ≤ n et k ∈                                      d’un solveur SAT sur cette contrainte. Comme l’évalua-
          J1, k3 J   Jk3 , k2 J      Jk , k J     Jk1 , nJ                   tion d’une valuation d’une contrainte CNF est linéaire par
                                l 2 2 1
         où k1 = n − 2, k2 =
                                 3n −2n log2 (n)−2n+2
                                                       m
                                                                             rapport à son nombre total de littéraux, on pourrait égale-
                                        4(n−1)
                 l 2
                  n +2n log2 (n)+n−1
                                      m                                      ment considérer le nombre total de littéraux de chacun de
         et k3 =                        .
                        2(n−1)                                               encodages plutôt que leur nombre de clauses comme cri-
                                                                             tère pour choisir un encodage. Même si le nombre total de
TABLE 2 – Encodage de ≤ k(x1 , ..., xn ) donnant le                          clauses est généralement utilisé comme critère de compa-
nombre total minimal de clauses en fonction de n et k                        raison des encodages dans l’état de l’art précité, on penche
  2. Les valeurs données ici sont exactes si n est une puissance de 2.       plutôt pour l’utilisation du nombre total de littéraux. En
tout état de cause, on présentera systèmatiquement par la      tient bien la contrainte souhaitée en appliquant les enco-
                                                                        n            n             n
suite les valeurs obtenues pour chacun de ces deux critères.   dages N≤n−k    , SeqU≤n−k  et SeqB≤n−k     à (¬x1 , ..., ¬xn ).
                                                                                          ¬n           ¬n               ¬n
Le tableau 3 permet de déterminer l’encodage avec le plus      On note respectivement N≤n−k , SeqU≤n−k       et SeqB≤n−k
petit nombre total de littéraux.                               ces trois encodages. On considère par ailleurs les deux en-
                                                                                n       n
                                                               codages SeqB≥k     et BB≥k,≤n  .
3.3   Contrainte ≥ k(x1 , ..., xn )                            Comme précédemment, on détermine les encodages don-
                                                               nant le nombre total minimal de clauses (tableau 4) ainsi
                 Conditions sur n et k par encodage            que les encodages donnant le nombre total minimal de lit-
        ¬n
       N≤n−k       SeqB≥k n           n
                                 BB≥k,≤n            ¬n
                                                SeqU≤n−k       téraux (5) en fonction de n et k. On remarque que, dans ce
                                                                                           ¬n
                                   n ≤ 5 et k ∈                cas, c’est l’encodage SeqB≤n−k     qui est écarté systémati-
        J1, nJ             ∅                 ∅       ∅         quement.
                            6 ≤ n ≤ 8 et k ∈
        J1, 5J             ∅           ∅          J5, nJ       3.4     Contrainte = k(x1 , ..., xn )
                           9 ≤ n ≤ 13 et k ∈                   Dans cette section, on compare 7 encodages différents de =
        J1, 4J             ∅           ∅          J4, nJ       k(x1 , ..., xn ) parmi lesquels 2 sont des encodages mixtes
                    14 ≤ n ≤ 30 et k ∈                         entre deux encodages différents. Il s’agit des encodages :
        J1, 4J    J4, k1 J      ∅                 Jk1 , nJ
                                                                          n          n
       où k1 = n−1
               
                 3
                    
                      .                                              1. BB=k (i.e. BB≥k,≤k );
                     31 ≤ n ≤ 36 et k ∈                                     n
                                                                     2. SeqB=k ;
        J1, 3J     J3, k J       ∅                Jk1 , nJ
                n−1  1                                                    ¬n
       où k1 =         .                                             3. SeqB=n−k ;
                  3
                              37 ≤ n et k ∈                                 n            n         ¬n
                                                                     4. SeqU=k (i.e. SeqU≤k et SeqU≤n−k );
        J1, 3J          J3, k2 J    Jk2 , k1 J    Jk1 , nJ
                                                                         n         n      ¬n
                     l 2
                 n −2n log2 (n)−n+1
                                          m                          5. N=k (i.e. N≤k et N≤n−k );
       où k1 =        2(n−1)
                                                                           n         n         ¬n
                                                                     6. N S=k (i.e. N≤k et SeqU≤n−k );
               l 2                  m
                n +2n log2 (n)−2n−2
       et k2 =        4(n−1)
                                      .
                                                                          n            n      ¬n
                                                                     7. SN=k (i.e. SeqU≤k et N≤n−k ).
TABLE 4 – Encodage de ≥ k(x1 , ..., xn ) donnant le
nombre total minimal de clauses en fonction de n et k          Comme dans les deux sections précédentes, on a determiné
                                                               les encodages donnant le nombre total de clauses minimal
                                                               en fonction de n et k ainsi que celui donnant le nombre to-
                 Conditions sur n et k par encodage            tal de littéraux minimal en fonction des mêmes paramètres.
        ¬n
       N≤n−k        SeqB≥k n           n
                                   BB≥k,≤n           ¬n
                                                 SeqU≤n−k      Chacun de ces résultats étant difficilement synthétisable en
                                   n ≤ 5 et k ∈                un seul tableau, on renvoie aux annexes pour le détail pour
        J1, nJ                 ∅              ∅          ∅     tous les entiers n ∈ J6, 17K.
                                   n = 6 et k ∈
      {1, 2, 3, 5}             ∅              ∅     k=4                                                      Proportion
                                                                         Encodage      Condition sur k
                                                                                                            en n → +∞
                                   n = 7 et k ∈                                n
                                                                           SN=k            1≤k<3                0%
        J1, 4J                 ∅              ∅     J4, nJ                      n
                                                                          SeqB=k          3 ≤ k < k2            25%
                            8 ≤ n ≤ 10 et k ∈                                  n
                                                                           BB=k          k2 ≤ k < k1            50%
        J1, 3J               ∅           ∅          J3, nJ                    ¬n
                                                                        SeqB=n−k       k1 ≤ k < n − 2           25%
                           11 ≤ n ≤ 27 et k ∈                                  n
                                                                           N S=k       n−2≤k <n                 0%
        J1, 3J l          J3, k1 Jm     ∅          Jk1 , nJ
                                                                                 l 2                    m
                                                                                   3n −2n log2 (n)−2n+3
                                                                        où k1 =
                     5n2 −15n+3                                                            4n−3
      où k1 =          3(5n−6)
                                      .                                          l 2
                                                                                  n +2n log2 (n)−n−3
                                                                                                     m
                                                                        et k2 =          4n−3
                                                                                                      .
                           28 ≤ n ≤ 148 et k ∈
        J1, 2J l          J2, k1 Jm      ∅         Jk1 , nJ
                     5n2 −15n+3
                                                               TABLE 6 – Encodage de = k(x1 , ..., xn ) donnant le
      où k1 =                         .
                       3(5n−6)                                 nombre total minimal de clauses en fonction de k pour
                             149 ≤ n et k ∈                    n ≥ 18
        J1, 2J           J2, k2 J    Jk2 , k1 J    Jk1 , nJ
                 l     2                    m
                2n −6n log2 (n)−11n+7                                                                n
      où k1 =
              l 2       5n−8
                                    m
                                                               Pour n ≤ 5, c’est l’encodage naïf N=k    qui donne les plus
      et k2 =
               3n +6n log2 (n)−4n−4
                     10(n−1)
                                     .                         petits nombres de clauses et de littéraux quel que soit k.
                                                               Les deux tableaux 6 et 7 donnent les résultats pour n ≥ 18.
                                                                                                         n      n
TABLE 5 – Encodage de ≥ k(x1 , ..., xn ) donnant le            On remarquera que les encodages SeqU=k      et N=k   en sont
nombre total minimal de littéraux en fonction de n et k        absents. Par ailleurs, on a indiqué, pour chaque encodage,
                                                               la limite de la proportion à n donné de valeurs différentes
Dans cette section, on compare 5 encodages pour la             de k pour laquelle cet encodage est optimal lorsque n tend
contrainte ≥ k(x1 , ..., xn ). Par l’équivalence (1), on ob-   vers l’infini.
                                                  Proportion                Encodage                         Nombre total de littéraux
             Encodage       Condition sur k                                    n
                                                 en n → +∞                 BB≥k   1 ,≤k2
                                                                                                     3n2 + 6n log2 (n) + 4n − k2 + k1 − 6
               SN=kn            k=1                  0%                         n
                                                                          SeqB≥k    1 ,≤k2
                                                                                                             10nk2 + 7n − 9k2 − 1
              SeqB=kn        2 ≤ k < k2              30%                     ¬n
                                                                        SeqB≥n−k    2 ,≤n−k1
                                                                                                        10n2 − 10nk1 − 2n + 9k1 − 1
               BB=kn        k2 ≤ k < k1              40%                  SeqU≥kn                  5n2 + 5n(k2 − k1 ) − 7n − 9(k2 − k1 ) + 2
                  ¬n                                                                1 ,≤k2
            SeqB=n−k       k1 ≤ k < n − 1            30%                      n                              (n − k2 ) kn + k1 kn
                                                                                                                                     
                                                                            N≥k    ,≤k
                   n
               N S=k          k =n−1                 0%                          1      2                                2          1
                                                                               n                         k1 kn + 5nk2 + n − 9k2 + 1
                                                                                                                
                     l 2                    m                                SN≥k 1 ,≤k2
                       7n −6n log2 (n)−6n+1                                                                   1
            où k1 =           10n−9                                             n
                                                                             N S≥k                (n − k2 ) kn + 5n2 − 5nk1 − 8n + 9k1 + 1
                                                                                                              
                     l 2                   m                                      1 ,≤k2                       2
                      3n +6n log2 (n)−3n−1
            et k2 =          10n−9
                                             .
                                                                       TABLE 9 – Nombre total de littéraux pour les encodages de
TABLE 7 – Encodage de = k(x1 , ..., xn ) donnant le                    la contrainte ≥ k1 , ≤ k2 (x1 , ..., xn )
nombre total minimal de littéraux en fonction de k pour
n ≥ 18
                                                                       vant pour choisir un encodage :
3.5        Contrainte ≥ k1 , ≤ k2 (x1 , ..., xn )
                                                                                                       3                      n
                                                                        Si         min(k2 , n − k1 ) ≥ 10 n        choisir BB≥k  1 ,≤k2
On étudie ici le cas d’une contrainte donnant un intervalle.                                   3
                                                                                                                               n
                                                                        Sinon si   k2 ≤ min 10 n, n − k1           choisir SeqB≥k   1 ,≤k2
On compare 7 encodages de cette contrainte, correspondant               Sinon                                                   ¬n
                                                                                                                   choisir SeqB≥n−k     2 ,≤n−k1
aux cas généraux des encodages de = k(x1 , ..., xn ) de la
section précédente. Il s’agit des encodages :                                                                                               (3)
           n
      1. BB≥k1 ,≤k2
                    ;                                                  Le protocole ci-dessus utilise le critère du nombre total de
             n                                                         littéraux minimal. Pour utiliser le critère du nombre total
      2. SeqB≥k 1 ,≤k2
                       ;
                                                                                                           3
             ¬n                                                        de clauses, il suffit de remplacer 10 par 41 .
      3. SeqB≥n−k2 ,≤n−k1
                          ;
                                           ¬n
             n
      4. SeqU≥k1 ,≤k2
                                n
                      (i.e. SeqU≤k2
                                    et SeqU≤n−k 1
                                                  );                   3.6    Contrainte ∈ K(x1 , ..., xn )
            n                n       ¬n
      5.   N≥k 1 ,≤k2
                      (i.e. N≤k2
                                 et N≤n−k 1
                                            );                         Dans cette section, on considère un sous-ensemble K =
           n                  n       ¬n                               {k1 , ..., km } ⊂ J0, nK avec m ≥ 2 et k1 < k2 < ... < km .
      6. SN≥k1 ,≤k2
                    (i.e. SeqU≤k2
                                  et N≤n−k 1
                                             );
            n                n          ¬n                             Le cas général d’une contrainte d’appartenance du cardi-
      7. N S≥k 1 ,≤k2
                      (i.e. N≤k  et SeqU≤n−k  ).
                               2            1                          nal à un sous-ensemble K se distingue entièrement des cas
On ne fait pas ici une comparaison exhaustive de toutes                précédents. En effet, la proposition k ∈ K est équivalente
                                                                                           m
les valeurs possibles de k et n comme on a pu le faire                 à la disjonction
                                                                                          W
                                                                                              [k = ki ]. Ainsi, à part le cas particu-
pour les contraintes précédentes car cela nous semble trop                                 i=1
fastidieux et difficilement exposable de manière concise.              lier d’un intervalle traité précédemment, on ne peut pas
On donne simplement les expressions des nombres totaux                 se ramener directement à une conjonction des encodages
de clauses et nombres totaux de littéraux pour chacun de               CNF décrits précédemment. Or obtenir une contrainte CNF
ces encodages. Ces expressions peuvent être évaluées au                à partir d’une disjonction de contraintes CNF nécessite une
cas par cas pour déterminer une valeur minimale et choisir             opération supplémentaire. Effectuer cette opération est pro-
l’encodage associé lorsque n est faible.                               hibitif si l’on considère directement des disjonctions des
                                                                       encodages précédents. Toutefois, on peut également consi-
     Encodage                         Nombre total de clauses          dérer ces disjonctions au sein d’un encodage séquentiel bi-
    BB≥kn
           1 ,≤k2
                              n2 + 2n log2 (n) + 2n − k2 + k1 − 2      directionnel unique ce qui permet de rendre cette opération
   SeqB≥kn                            4nk2 + 3n − 3k2 + 1              tout à fait envisageable.
            1 ,≤k2
      ¬n
 SeqB≥n−k                            4n2 − 4nk1 + 3k1 + 1
            2 ,≤n−k1                                                   En effet, la contrainte suivante est bien un encodage de la
   SeqU≥kn                  2n2 + 2n(k2 − k1 ) − n − 3(k2 − k1 ) − 2
            1 ,≤k2                                                     contrainte ∈ K(x1 , ..., xn ).
                                            n 
       n                                        + k n−1
                                                         
     N≥k1 ,≤k2                            k2 +1      1
        n                           n   
      SN≥k1 ,≤k2                  k1 −1
                                          + 2nk2 + n − 3k2 − 1                             m
                                                                                                                         !
         n                      n         2 − 2nk − 2n + 3k − 1
                                                                                           _
      N S≥k1 ,≤k2             k +1
                                     +  2n         1          1                  n
                                                                             SeqB# ∧             (sn,ki ∧ ¬sn,ki +1 )                       (4)
                                2

                                                                                           i=1
TABLE 8 – Nombre total de clauses pour les encodages de
la contrainte ≥ k1 , ≤ k2 (x1 , ..., xn )                              Cette encodage n’est pas une contrainte CNF mais on peut
                                                                       se ramener à une contrainte CNF équisatisfaisable faci-
Sinon, en dehors de certains effets de bord quand k1 ≤ 2               lement en introduisant m variables supplémentaires y0 ,
                                                                                                                          n
ou bien k2 ≥ n − 2, on peut voir que, pour n suffisam-                 ..., ym−1 [8]. On définit ainsi l’encodage SeqB∈K       de la
ment grand, ce sont les trois premiers encodages qui sont              contrainte ∈ K(x1 , ..., xn ) comme étant la contrainte CNF
les plus performants. On peut alors utiliser le protocole sui-         ci-dessous :
                                                                      l’accroissement. Cet argument ne tient toutefois pas long-
                                                          !!          temps car un gain fixe sur une opération peut être non négli-
                    m                         m−1                     geable, d’autant plus si cette opération est répétée de nom-
        n
                    V                          W
    SeqB#      ∧          sn,ki ∨ ¬yi−1 ∨            yj               breuses fois au cours d’un même processus.
                    i=1                        j=i
                    m                                m−1
                                                                !!    Par ailleurs, le nouvel encodage séquentiel bidirectionnel
                                                                      qui est proposé dans cet article offre une performance net-
                    V                                 W
               ∧          ¬sn,ki +1 ∨ ¬yi−1 ∨              yj
                    i=1                              j=i              tement améliorée dans certains cas ainsi que des perspec-
               ∧ y0                                                   tives nouvelles.
                                                          n           En effet, dans le cas d’une contrainte de type =
                                                     (SeqB∈K )
                                                                      k(x1 , ..., xn ), les nombres totaux de clauses et de littéraux
Cette contrainte a un nombre total de clauses égal à :                sont au mieux quadratiques en n pour les autres encodages
                                                                      et ceci quel que soit k. Toutefois, dans un certain nombre de
     4nkm + 3n − 3km + 2m                                       (5)   problèmes, k est fixé indépendamment de n. Les nombres
                                                                      totaux de clauses et de littéraux de l’encodage séquentiel
et un nombre total de littéraux égal à :                              bidirectionnel sont alors linéaires en n. Cet encodage a
                                                                      ainsi pu être mis à profit dans le cas de la résolution SAT
     10nkm + 7n − 9km + m2 + 3m − 2                             (6)   d’un problème d’emploi du temps en BTS [6] qui comporte
                                                                      un certain nombre de contraintes de type = 3(x1 , ..., xn ).
                                                   n
Enfin, on peut remarquer que l’encodage SeqB∈K          (où K         Cet encodage offre également de nouvelles perspectives via
est le complèmentaire de K) appliqué à (¬x1 , ..., ¬xn )              son application aux contraintes de type ∈ K(x1 , ..., xn )
donne également la contrainte ∈ K(x1 , ..., xn ). On note             pour lesquelles il n’existait pas avant, à notre connaissance,
       ¬n
SeqB∈K      cet encodage. Il peut éventuellement être plus            d’encodage performant.
performant que l’encodage précédent selon K. Son nombre               Enfin, on peut noter que sa présentation explicite (sem-
total de clauses et son nombre total de littéraux s’ob-               blable à celle de l’encodage séquentiel dans [12] et qui a
tiennent en remplaçant km par max(K) et m par n − m                   sûrement contribué à sa popularité) en permet une implé-
dans (5) et (6).                                                      mentation directe.
Le pire des cas est atteint pour une contrainte de type k             Le travail de recherche présenté dans cet article est d’ordre
pair. On a alors un nombre de clauses de l’ordre de 4n2 et            théorique. Si les critères du nombre total de clauses ou du
un nombre de littéraux de l’ordre de 10.5n2 ce qui est tout à         nombre total de littéraux sont généralement pertinents, ils
fait raisonnable. Par ailleurs, à notre connaissance, il s’agit       ne suffisent pas à déterminer l’encodage le mieux adapté
du seul encodage CNF de la littérature de la contrainte ∈             qui pourra dépendre non seulement du problème considéré
K(x1 , ..., xn ).                                                     mais également du solveur utilisé. Il appelle donc d’autres
                                                                      travaux qui permettront de mettre en pratique (tels que [6])
4    Conclusion                                                       et de valider ces résultats. Il sera également prolongé de
                                                                      manière à intégrer au processus de choix des encodages à
Lorsque l’on recherche un algorithme optimisé pour un
                                                                      base de réseaux dont l’encodage de ≤ k(x1 , ..., xn ) défini
problème donné, il est rare de découvrir un seul algorithme
                                                                      dans [2].
qui soit le plus optimisé pour chacune des occurrences de
ce problème. Pour le problème d’une résolution CNF-SAT
d’une contrainte de cardinalité, on peut remarquer que cha-
                                                                      5         Annexe
cun des encodages d’une contrainte de cardinalité considé-
                                                                                n
rés dans cet article est préférable aux autres pour au moins           k
                                                                                    6   7   8   9   10   11   12   13   14   15   16   17
                                                                           1        6   6   6   6   6    6    6    6    6    6    6    6
quelques valeurs différentes de k et n. Par ailleurs, les com-             2        5   6   6   6   6    6    6    6    6    6    6    6
                                                                           3        5   5   6   6   6    6    6    6    6    6    6    6
portements des différentes solutions à l’infini ne préjugent               4        5   5   5   4   2    2    2    2    2    2    2    2
                                                                           5        7   7   7   4   1    1    1    2    2    2    2    2
en rien quant à leurs comportements en faible dimension.                   6            7   7   7   3    1    1    1    1    1    1    2
                                                                           7                7   7   7    3    1    1    1    1    1    1
Par exemple dans le cas des contraintes ≤ k(x1 , ..., xn )                 8                    7   7    7    3    3    1    1    1    1
                                                                           9                        7    7    7    3    3    1    1    1
et ≥ k(x1 , ..., xn ), l’encodage proposé par Bailleux et                  10                            7    7    7    3    3    1    1
                                                                           11                                 7    7    7    3    3    3
Boufkhad est préférable (selon le critère du nombre total                  12                                      7    7    7    3    3
                                                                           13                                           7    7    7    3
de littéraux) dans environ 10% des cas lorsque n est très                  14                                                7    7    7
                                                                           15                                                     7    7
grand mais n’est préférable en aucun cas lorsque n < 149.                  16                                                          7

Afin de pouvoir déterminer l’encodage réellement le mieux
adapté à une contrainte et des paramètres donnés, il est né-          TABLE 10 – Encodage de la contrainte = k(x1 , ..., xn )
cessaire de passer par une étude exhaustive des cas comme             donnant le nombre total minimal de clauses pour n ∈
cela a été réalisé dans cet article.                                  J6, 17K
On pourrait objecter que, si n est petit alors la taille de
l’encodage le sera également et qu’en conséquence, même               Les tableaux 10 et 11 donnent, en fonction de k et n, les
si on reste loin de l’optimum possible, on pourra négliger            encodages de = k(x1 , ..., xn ) pour n ∈ J6, 17K ayant un
          n
 k
              6   7   8   9   10   11   12   13   14   15   16   17   [10] J. Marques-Silva and I. Lynce. Towards robust cnf
     1        6   6   6   6   6    6    6    6    6    6    6    6
     2        6   6   6   6   6    6    6    6    6    6    6    2         encodings of cardinality constraints. Principles and
     3        5   6   4   2   2    2    2    2    2    2    2    2
     4        7   7   4   4   4    2    2    2    2    2    2    2         Practice of Constraint Programming–CP 2007, pages
     5        5   7   4   4   4    4    2    2    2    2    2    2
     6            7   7   3   4    4    4    4    2    2    2    2         483–497, 2007.
     7                7   7   3    3    3    4    4    4    2    2
     8
     9
                          7   7
                              7
                                   3
                                   7
                                        3
                                        3
                                             3
                                             3
                                                  3
                                                  3
                                                       4
                                                       3
                                                            4
                                                            3
                                                                 4
                                                                 4
                                                                      [11] MiniZinc. Minizinc challenge 2017 results, 2017.
     10                            7    7    3    3    3    3    3
     11                                 7    7    3    3    3    3    [12] C. Sinz. Towards an optimal cnf encoding of boolean
     12                                      7    7    3    3    3
     13                                           7    7    3    3         cardinality constraints. CP, 3709 :827–831, 2005.
     14                                                7    3    3
     15                                                     7    3
     16                                                          7    [13] P. J. Stuckey, T. Feydy, A. Schutt, G. Tack, and J. Fi-
                                                                           scher. The minizinc challenge 2008–2013. AI Maga-
TABLE 11 – Encodage de la contrainte = k(x1 , ..., xn )                    zine, 35(2) :55–60, 2014.
donnant le nombre total minimal de littéraux pour n ∈                 [14] N. Tamura, M. Banbara, and T. Soh. Compiling
J6, 17K                                                                    pseudo-boolean constraints to sat with order enco-
                                                                           ding. In Tools with Artificial Intelligence (ICTAI),
nombre total minimal de clauses et de littéraux respective-                2013 IEEE 25th International Conference on, pages
ment. Les encodages sont indiqués dans le tableau par un                   1020–1027. IEEE, 2013.
numéro qui correspond à leur numérotation dans la section             [15] J. P. Warners. A linear-time transformation of linear
3.4.                                                                       inequalities into conjunctive normal form. Informa-
                                                                           tion Processing Letters, 68(2) :63–69, 1998.
Références
 [1] R. Asín, R. Nieuwenhuis, A. Oliveras, and
     E. Rodríguez-Carbonell.       Cardinality networks
     and their applications. In International Conference
     on Theory and Applications of Satisfiability Testing,
     pages 167–180. Springer, 2009.
 [2] R. Asín, R. Nieuwenhuis, A. Oliveras, and
     E. Rodríguez-Carbonell. Cardinality networks :
     a theoretical and empirical study. Constraints,
     16(2) :195–221, 2011.
 [3] O. Bailleux and Y. Boufkhad. Efficient cnf encoding
     of boolean cardinality constraints. In International
     conference on principles and practice of constraint
     programming, pages 108–122. Springer, 2003.
 [4] O. Bailleux, Y. Boufkhad, and O. Roussel. A trans-
     lation of pseudo-boolean constraints to sat. Jour-
     nal on Satisfiability, Boolean Modeling and Compu-
     tation, 2 :191–200, 2006.
 [5] O. Bailleux, Y. Boufkhad, and O. Roussel. New enco-
     dings of pseudo-boolean constraints into cnf. In Inter-
     national Conference on Theory and Applications of
     Satisfiability Testing, pages 181–194. Springer, 2009.
 [6] T. Delacroix. Planifier l’épreuve e5 à l’aide d’un
     solveur sat. In APIA, Conférence Nationale sur les
     Applications Pratiques de l’Intelligence Artificielle,
     2018.
 [7] N. Eén and N. Sorensson. Translating pseudo-
     boolean constraints into sat. Journal on Satisfiability,
     Boolean Modeling and Computation, 2 :1–26, 2006.
 [8] ENS. Concours d’admission - composition d’infor-
     matique - a -, 2016.
 [9] A. M. Frisch and P. A. Giannaros. Sat encodings of
     the at-most-k constraint. some old, some new, some
     fast, some slow. In Proc. of the Tenth Int. Workshop
     of Constraint Modelling and Reformulation, 2010.