Ikatan squish-unsquish

Berikut adalah daftar dari beberapa pengikat umum di Unicode (yang bisa saya buat dengan kunci Tulis saya di Debian):

Orig  Ascii  Lig
ae    [ae]   æ
AE    [AE]   Æ
oe    [oe]   œ
OE    [OE]   Œ
ij    [ij]   ĳ
IJ    [IJ]   Ĳ
ff    [ff]   ﬀ
fi    [fi]   ﬁ
fl    [fl]   ﬂ
ffi   [ffi]  ﬃ
ffl   [ffl]  ﬄ

Anda memiliki dua opsi dalam tantangan ini: gunakan ligatur UTF-8 yang sebenarnya, atau gunakan varian ASCII saja. Jika Anda menggunakan varian ligatur UTF-8 yang sebenarnya, Anda mendapatkan bonus 20%. Jika Anda menggunakan varian ASCII saja, Anda dapat menganggap tanda kurung tidak akan pernah terlibat kecuali untuk menandakan ligatur.

Tantangannya: diberi string sebagai input, output string yang sama

dengan semua ikatan asli digantikan oleh rekan-rekan mereka yang diperluas.
- cocok dengan rakus: affibmenjadi aﬃb( a[ffi]b), bukan aﬀib( a[ff]ib) atau afﬁb( af[fi]b).
dengan semua urutan huruf "diperluas" digantikan oleh ligatur.
- misalnya, æOEfoo( [ae]OEfoo) menjadi aeŒfoo( ae[OE]foo).

Lakukan ini sepenuhnya independen: ﬀi( [ff]i) menjadi ffi( ffi), bukan ﬃ ( [ffi]).

Kedengarannya cukup sederhana? Ada tangkapan: setiap kali dua non-pengikat tumpang tindih dengan tepat satu karakter , kedua pengikat harus dimasukkan ke dalam string. Berikut adalah beberapa kasus uji untuk ditunjukkan:

Input   Ascii-output      Output
fij     [fi][ij]          ﬁĳ
fIJ     f[IJ]             fĲ     * remember, capitalization matters!
fffi    [ff][ffi]         ﬀﬃ
fff     [ff][ff]          ﬀﬀ
ffffi   [ff][ff][ffi]     ﬀﬀﬃ
ffffij  [ff][ff][ffi][ij] ﬀﬀﬃĳ

Hati-hati: pencocokan serakah yang sama berlaku (perhatikan terutama beberapa kasus tes terakhir).

kode-golf , jadi kode terpendek dalam byte menang.

code-golf string unicode Gagang pintu
sumber

@Mego Apa masalahnya? Jika bahasa pilihan Anda tidak dapat menangani secara alami, cukup cetak 0xc3 0xa6, penyandian UTF-8.

Dennis

Jika suatu bahasa tidak dapat memfasilitasi tugas yang diberikan, jangan gunakan bahasa itu untuk tugas itu. Itu seharusnya tidak menjadi masalah besar.

Alex A.

Jawaban:

JavaScript (ES6), 213 byte - 20% bonus = 170,4

s=>eval('for(p=o="";m=s.match(r="ﬄ|ﬃ|ﬂ|ﬁ|ﬀ|Ĳ|ĳ|Œ|œ|Æ|æ|ffl|ffi|fl|fi|ff|IJ|ij|OE|oe|AE|ae",x=r.split`|`);s=s.slice(i+t.length-(p=t<"z")))o+=s.slice(p,i=m.index)+x[(x.indexOf(t=m[0])+11)%22];o+s.slice(p)')

Penjelasan

s=>                           // s = input string
  eval(`                      // use eval to avoid writing {} or return
    for(                      // iterate over each ligature match
      p=                      // p = 1 if the last match was a non-unicode ligature
        o="";                 // o = output string
      m=s.match(              // find the next ligature

        // r = regex string for ligatures (unicode and non-unicode)
        r="ﬄ|ﬃ|ﬂ|ﬁ|ﬀ|Ĳ|ĳ|Œ|œ|Æ|æ|ffl|ffi|fl|fi|ff|IJ|ij|OE|oe|AE|ae",
        x=r.split\`|\`        // x = arrray of r

      );
      s=s.slice(i+t.length    // remove the part that has been added to the output
        -(p=t<"z"))           // if we matched a non-unicode ligature, keep the last
    )                         //     character so it can be part of the next match
      o+=s.slice(p,i=m.index) // add the text before the match to the output
        +x[(x.indexOf(        // add the opposite type of the matched ligature
          t=m[0]              // t = matched text
        )+11)%22];            // (index + 11) % 22 returns the opposite index
    o+s.slice(p)              // return o + any remaining characters
  `)

Uji

Tampilkan cuplikan kode

var solution = s=>eval('for(p=o="";m=s.match(r="ﬄ|ﬃ|ﬂ|ﬁ|ﬀ|Ĳ|ĳ|Œ|œ|Æ|æ|ffl|ffi|fl|fi|ff|IJ|ij|OE|oe|AE|ae",x=r.split`|`);s=s.slice(i+t.length-(p=t<"z")))o+=s.slice(p,i=m.index)+x[(x.indexOf(t=m[0])+11)%22];o+s.slice(p)')

<input type="text" id="input" value="ﬀiffffij" oninput="result.textContent=solution(input.value)" />
<pre id="result"></pre>

Expand snippet

pengguna81655
sumber

Dapat r="ﬄ|ﬃ|ﬂ|ﬁ|ﬀ|Ĳ|ĳ|Œ|œ|Æ|æ|ffl|ffi|fl|fi|ff|IJ|ij|OE|oe|AE|ae",x=r.split`|`ditulis ulang x="ﬄ|ﬃ|ﬂ|ﬁ|ﬀ|Ĳ|ĳ|Œ|œ|Æ|æ|ffl|ffi|fl|fi|ff|IJ|ij|OE|oe|AE|ae".split`|`untuk -4 byte?

Dendrobium

@Dendrobium matchPanggilan membutuhkan string yang dipisahkan dengan |karakter.

user81655