{"id":2327,"date":"2022-02-21T19:46:49","date_gmt":"2022-02-21T18:46:49","guid":{"rendered":"https:\/\/ekiwi.de\/?p=2327"},"modified":"2023-08-13T11:30:16","modified_gmt":"2023-08-13T09:30:16","slug":"anti-spam-hi-spam-nachrichten","status":"publish","type":"post","link":"https:\/\/ekiwi.de\/index.php\/2327\/anti-spam-hi-spam-nachrichten\/","title":{"rendered":"Anti-Spam: Hi, Spam &#8211; Preisanfragen"},"content":{"rendered":"<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Inhalt<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Toggle Table of Content\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/ekiwi.de\/index.php\/2327\/anti-spam-hi-spam-nachrichten\/#Der_Spam\" >Der Spam<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/ekiwi.de\/index.php\/2327\/anti-spam-hi-spam-nachrichten\/#Das_Ziel_der_Spammer\" >Das Ziel der Spammer<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/ekiwi.de\/index.php\/2327\/anti-spam-hi-spam-nachrichten\/#Antispam-Massnahmen\" >Antispam-Ma\u00dfnahmen<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/ekiwi.de\/index.php\/2327\/anti-spam-hi-spam-nachrichten\/#Fazit\" >Fazit<\/a><\/li><\/ul><\/nav><\/div>\n<p>Eine neue Masche der Spammer, automatische \u00dcbersetzungen.<\/p>\n<p><!--more--><\/p>\n<p>Spammer und Anti-Spam-Ma\u00dfnahmen liefern sich stets einen Wettlauf. Wir kennen das Problem von unserer Software DA-FormMaker, einer Software zur <a href=\"https:\/\/da-software.net\/software\/da-formmaker\/\" target=\"_blank\" rel=\"noopener\">Erstellung von HTML-Formularen<\/a>.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Der_Spam\"><\/span>Der Spam<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Eine typische Spammail sieht in etwa so aus:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-2328\" src=\"\/wp-content\/uploads\/2022\/02\/hi_spam_1.png\" alt=\"\" width=\"333\" height=\"180\" srcset=\"\/wp-content\/uploads\/2022\/02\/hi_spam_1.png 333w, \/wp-content\/uploads\/2022\/02\/hi_spam_1-300x162.png 300w\" sizes=\"auto, (max-width: 333px) 100vw, 333px\" \/><\/p>\n<p>Der Text variiert in verschiedenen Sprachen, daher ist eine automatische Erkennung schwierig. Folgende Texte kommen, unter anderem, zum Einsatz.<\/p>\n<blockquote><p>Hai, saya ingin tahu harga Anda.<br \/>\nSveiki, a norjau suinoti js kain.<br \/>\nHola, qudr\u00eda saber tu precio..<br \/>\nSalut, ech wollt Are Prais wessen.<br \/>\nNdewo, achr m mara naha g.<br \/>\nHola, quer\u00eda saber tu precio..<br \/>\nHi, ego volo scire vestri pretium.<br \/>\nHallo, ek wou jou prys ken<br \/>\nZdravo, htio sam znati va\u0161u cijenu.<br \/>\nCiao, volevo sapere il tuo prezzo.<br \/>\nHi, I wanted to know your price.<br \/>\nOla, queria saber o seu prezo.<br \/>\nHi, kam dashur te di cmimin tuaj<\/p><\/blockquote>\n<p>Die Spammer scheinen hier einfach eine &#8222;Preisanfage&#8220; zu simulieren, in verschiedenen Sprachen. Hierbei kommen auch recht viele exotische Sprachen zum Einsatz.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-2329\" src=\"\/wp-content\/uploads\/2022\/02\/hi_spam_2.png\" alt=\"\" width=\"1000\" height=\"159\" srcset=\"\/wp-content\/uploads\/2022\/02\/hi_spam_2.png 1000w, \/wp-content\/uploads\/2022\/02\/hi_spam_2-300x48.png 300w, \/wp-content\/uploads\/2022\/02\/hi_spam_2-768x122.png 768w\" sizes=\"auto, (max-width: 1000px) 100vw, 1000px\" \/><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Das_Ziel_der_Spammer\"><\/span>Das Ziel der Spammer<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Die wenigsten d\u00fcrften mit der Sprache etwas anfangen k\u00f6nnen und das vermutliche Ziel d\u00fcrfte am Ende auch nur ein, die Leute zu animieren auf die E-Mail zu antworten. Dies habe ich mit zahlreichen Mail-Adressen ausprobiert. Die meisten blieben unbeantwortet. Vermutlich, weil die E-Mail-Adressen schnell von den Anbietern gesperrt werden.<\/p>\n<p>In den F\u00e4llen einer Antwort wurden dann irgendwelche Bitcoin-Systeme beworben.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-2330\" src=\"\/wp-content\/uploads\/2022\/02\/hi_spam_3.png\" alt=\"\" width=\"618\" height=\"205\" srcset=\"\/wp-content\/uploads\/2022\/02\/hi_spam_3.png 618w, \/wp-content\/uploads\/2022\/02\/hi_spam_3-300x100.png 300w\" sizes=\"auto, (max-width: 618px) 100vw, 618px\" \/><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Antispam-Massnahmen\"><\/span>Antispam-Ma\u00dfnahmen<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Durch die \u00dcbersetzungen ist es nicht so einfach den Spam zu klassifizieren. Mein Ansatz war dies mit einem <a title=\"Regex f\u00fcr E-Mail\" href=\"https:\/\/ekiwi-blog.de\/54095\/regex-fuer-e-mail\/\">RegEx<\/a> zu erschlagen.<\/p>\n<pre>^(([a-z,A-Z]{2,8}),)(\\s+\\w+){4,6}\\.?\\.?$\r\n<\/pre>\n<p>Der RegEx pr\u00fcft auf das Anfangswort (die Begr\u00fc\u00dfung), dann folgt ein Komma und 4 bis 6 W\u00f6rter. Optional mit einem Satzzeichen (Punkt am Ende).<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-2331\" src=\"\/wp-content\/uploads\/2022\/02\/hi_spam_4.png\" alt=\"\" width=\"514\" height=\"419\" srcset=\"\/wp-content\/uploads\/2022\/02\/hi_spam_4.png 514w, \/wp-content\/uploads\/2022\/02\/hi_spam_4-300x245.png 300w\" sizes=\"auto, (max-width: 514px) 100vw, 514px\" \/><\/p>\n<p>In PHP habe ich ich die Funktion dann wie folgt umgesetzt:<\/p>\n<pre>function spam_check_hi_spam($subject) {\r\n    $startWords = [\"Hai,\", \"Ola,\", \"Sveiki,\", \"Ndewo,\", \"Hola,\", \"Salut,\", \"Hi,\", \"Hallo,\", \"Ciao,\", \"Zdravo,\"];\r\n\r\n    $boolStarts = false;\r\n    $isSpam = false;\r\n\r\n    foreach ($startWords as $words) {\r\n        if (startsWith($subject, $words)) {\r\n            $boolStarts = true;\r\n        }\r\n    }\r\n\r\n    if ($boolStarts === true) {\r\n        if (preg_match('\/^(([a-z,A-Z]{2,8}),)(\\s+\\w+){4,6}\\.?\\.?$\/m', $subject)) {\r\n            $isSpam = true;\r\n        }\r\n    }\r\n\r\n    return $isSpam;\r\n}<\/pre>\n<p>Neben der \u00dcberpr\u00fcfung des regul\u00e4ren Ausdrucks pr\u00fcfe ich hier noch den Anfang, ob die spezielle Begr\u00fc\u00dfungsfloskel vorkommt. Dies sollte sicherstellen, dass es weniger falsch positive Ergebnisse gibt. Je nachdem zu welchen Sprachen die Spammer noch ausweichen, muss das Array entsprechend erweitert werden.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Fazit\"><\/span>Fazit<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Derzeit l\u00e4uft der Filter recht zufriedenstellend. Allzu exotische Begr\u00fc\u00dfungsfloskeln lassen sich auch recht leicht mittels <a href=\"https:\/\/da-software.net\/2020\/08\/spamschutz-im-formmail-script\/\" target=\"_blanK\" rel=\"noopener\">Blacklist blockieren<\/a>.<\/p>","protected":false},"excerpt":{"rendered":"<p>Eine neue Masche der Spammer, automatische \u00dcbersetzungen.<\/p>\n","protected":false},"author":1,"featured_media":2332,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","_links_to":"","_links_to_target":""},"categories":[591],"tags":[592,29,134],"class_list":["post-2327","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-security","tag-antispam","tag-mail","tag-spam"],"_links":{"self":[{"href":"https:\/\/ekiwi.de\/index.php\/wp-json\/wp\/v2\/posts\/2327","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ekiwi.de\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ekiwi.de\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ekiwi.de\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/ekiwi.de\/index.php\/wp-json\/wp\/v2\/comments?post=2327"}],"version-history":[{"count":0,"href":"https:\/\/ekiwi.de\/index.php\/wp-json\/wp\/v2\/posts\/2327\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/ekiwi.de\/index.php\/wp-json\/wp\/v2\/media\/2332"}],"wp:attachment":[{"href":"https:\/\/ekiwi.de\/index.php\/wp-json\/wp\/v2\/media?parent=2327"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ekiwi.de\/index.php\/wp-json\/wp\/v2\/categories?post=2327"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ekiwi.de\/index.php\/wp-json\/wp\/v2\/tags?post=2327"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}