...
Pokud je režim nastavený na blacklist, jsou zásilky se soubory, který vyhovují vyjmenovaným MIME typům, blokovány. Pokud je režim nastavený na whitelist, jsou blokovány všechny zásilky, jejichž soubory mají jiný než vyjmenované MIME typy.
Vybrané typy souborů
Nastavuje MIME typy, které se mají hledat pro blacklist nebo whitelist. Na každém řádku je jeden MIME typ. Seznam může být prázdný, což v režimu blacklist způsobuje, že nic není na základě typů blokováno, ale detekce probíhá a zpřesněné MIME typy jsou k souborům zapisovány.
...
U některých typů obsahu pak probíhá detekce hloubkově, kdy se zkoumají i vnořené soubory (např. v archivech, office dokumentech, apod.). Tyto typy hloubkově zkoumaných kontejnerů jsou uvedeny zde: https://tika.apache.org/1.22/formats.html.
Jednoduchý tip, jak zjistit MIME typ nějakého souboru, je ho prostě poslat do aplikace SOFiE a následně se podívat, jaký MIME typ u něj byl rozpoznán.
Alternativně lze toto vyčíst z výše uvedeného seznamu podporovaných mime typů, kde například pro soubor typu *.avi specifikace uvádí:
Code Block | ||
---|---|---|
| ||
<mime-type type="video/x-msvideo">
<_comment>Audio Video Interleave File</_comment>
<alias type="video/avi"/>
<alias type="video/msvideo"/>
<magic priority="50">
<match value="RIFF....AVI " type="string" offset="0"
mask="0xFFFFFFFF00000000FFFFFFFF"/>
<match offset="8" type="string" value="\x41\x56\x49\x20"/>
</magic>
<glob pattern="*.avi"/>
</mime-type> |
A tedy MIME typ takového souboru je video/x-msvideo.
Příklad konfigurace
...