Nastavení detekce MIME typů
V dialogu Nastavení MIME je možné upravit nastavení nástroje MIME detekce. Kromě funkce blacklistu / whitelistu zadaných MIME typů provádí nástroj MIME detekce také zpřesnění MIME typů všech souborů (původní MIME typ odeslaný prohlížečem nemusí být spolehlivý). Chceme-li tedy mít co nejpřesnější určení MIME typů u souborů zásilek, je vhodné mít MIME detekci zapnutou, i pokud není nastaveno žádné blokování.
Nastavit je možné následující parametry:
Limit max velikosti souboru
Určuje maximální velikost souboru pro kterou se ještě provádí kontrola. Kontrola tímto modulem se provádí v paměti a v případě archivů a jiných kontejnerů provádí extrakci celého jejich obsahu do paměti. Nedoporučujeme tak nastavovat hodnotu vyšší než zhruba 10% paměti serveru.
Považovat nadlimitní za v pořádku
Pokud je tato volba aktivní a kontrola souboru je vynechaná z důvodu překročení maximální velikosti souboru, je soubor považován za “v pořádku” (tj. jako by kontrola proběhla a nenašla problém). Pokud je tato volba neaktivní, je soubor považován za “podezřelý” (tj. jako by kontrola proběhla a našla problém) a celá zásilka skončí v karanténě.
Maximální počet uložených záznamů o nalezených objektech
V některých kontejnerech (typicky archivy jako zip, apod.) se může vyskytovat velké množství vnořených souborů/objektů a seznam všech nalezeným MIME typů tak může být velmi dlouhý. Tento limit omezuje maximální počet uložených záznamů o MIME typech nalezených v jednom souboru. Limit byl zaveden proto, aby nedocházelo k problémům se zobrazením a také nadměrnému zaplňování databáze. Limit nemá vliv na detekci dle zadaných MIME typů (hledá se ve všech MIME záznamech, nejen v těch co se vejdou do limitu a uloží).
Režim detekce
Pokud je režim nastavený na blacklist, jsou zásilky se soubory, který vyhovují vyjmenovaným MIME typům, blokovány. Pokud je režim nastavený na whitelist, jsou blokovány všechny zásilky, jejichž soubory mají jiný než vyjmenované MIME typy.
Vybrané typy souborů
Nastavuje MIME typy, které se mají hledat pro blacklist nebo whitelist. Na každém řádku je jeden MIME typ. Seznam může být prázdný, což v režimu blacklist způsobuje, že nic není na základě typů blokováno, ale detekce probíhá a zpřesněné MIME typy jsou k souborům zapisovány.
Mime typy mohou být zadávány i ve formě regulárních výrazů, tedy například následující je platné zadání skupiny MIME typů: “video/.*”, které pokryje veškeré známé video formáty.
Podporované MIME typy jsou uvedeny v následujícím seznamu: https://raw.githubusercontent.com/apache/tika/master/tika-core/src/main/resources/org/apache/tika/mime/tika-mimetypes.xml
U některých typů obsahu pak probíhá detekce hloubkově, kdy se zkoumají i vnořené soubory (např. v archivech, office dokumentech, apod.). Tyto typy hloubkově zkoumaných kontejnerů jsou uvedeny zde: https://tika.apache.org/1.22/formats.html.
Jednoduchý tip, jak zjistit MIME typ nějakého souboru, je ho prostě poslat do aplikace SOFiE a následně se podívat, jaký MIME typ u něj byl rozpoznán.
Alternativně lze toto vyčíst z výše uvedeného seznamu podporovaných mime typů, kde například pro soubor typu *.avi specifikace uvádí:
<mime-type type="video/x-msvideo">
<_comment>Audio Video Interleave File</_comment>
<alias type="video/avi"/>
<alias type="video/msvideo"/>
<magic priority="50">
<match value="RIFF....AVI " type="string" offset="0"
mask="0xFFFFFFFF00000000FFFFFFFF"/>
<match offset="8" type="string" value="\x41\x56\x49\x20"/>
</magic>
<glob pattern="*.avi"/>
</mime-type>
A tedy MIME typ takového souboru je video/x-msvideo.
Příklad konfigurace