MediaWiki Diskussion:Spam-blacklist/Archiv/2008

Letzter Kommentar: vor 15 Jahren von Lustiger seth in Abschnitt verbesserungsvorschlaege
Dies ist ein Archiv! Diskussionen werden nicht hier fortgesetzt, sondern auf der eigentlichen Diskussionsseite: WP:SBL.
Bei Bezug zu einem bereits behandelten Thema ist jedoch ein Link ins Archiv hilfreich.

Bugs

Bearbeiten

meta vs. dt

Bearbeiten

bei geblockten websites wird nicht gesagt, _wo_ sie geblockt werden. es wird nur auf diese diskussion verwiesen. jetzt ist mir auch klar, warum hier so viele leute nach meta-geblockten seiten ausgerechnet hier fragen. der vorlagentext mit der ueberschrift "Spamschutzfilter" sollte dahingehend abgeaendert werden, dass auf die jeweils richtige blacklist verwiesen wird. -- seth 23:52, 13. Mär. 2008 (CET)Beantworten

durch die obige anleitung sollte das ja eigentlich kein problem mehr darstellen. -- seth 02:03, 14. Mai 2008 (CEST)Beantworten

Tippos (erl.)

Bearbeiten

In der Blacklist sind ein paar Tippos, Wecowi wird wegen eines Leerzeichens nicht geblockt, der Rest sind Kleinigkeiten.

football-talents\.co.uk -> football-talents\.co\.uk

wecowi\. (?:net|org|de) -> wecowi\.(?:net|org|de)

de.groups.yahoo\.com/group/BIID-deutsch -> de\.groups\.yahoo\.com/group/BIID-deutsch

blue\.de.vu -> blue\.de\.vu --Richarddd 10:43, 1. Jun. 2008 (CEST)Beantworten

danke und erl. sугсго 10:50, 1. Jun. 2008 (CEST)Beantworten

ubema.com

Bearbeiten

Sperre greift nicht, siehe [1]. Gruß, Seewolf 10:33, 22. Dez. 2008 (CET)Beantworten

doch, doch, die sperre greift schon, jedoch nur, wenn der link nicht bereits auf der seite existiert. da er in diesem fall aber bereits existierte, wurde die erneute linksetzung nicht beanstandet. macht sogar sinn, denn wenn der erste link nicht als "boese" eingestuft wird, ist die wahrscheinlichkeit gross, dass auch das zweite vorkommnis nicht "boese" ist, sondern vielleicht einfach darueber diskutiert wird. -- seth 12:36, 22. Dez. 2008 (CET)Beantworten

verbesserungsvorschlaege

Bearbeiten

gudn tach!
da ich die aktuelle spam-liste mittlerweile ziemlich unuebersichtlich finde, habe ich sie kopiert und innerhalb der sparten sortiert nach secondlevel-domains (bzw. nach third-level-doms bei sowas wie example.de.cx). ferner habe ich einige unmaskierte punkte maskiert.
da ich aber keine schreibrechte besitze, habe ich das ganze in meinen userspace gesetzt. geloescht oder hinzugefuegt habe ich _keine_ url-pattern, sondern lediglich einige pattern gruppiert, weshalb jetzt die liste wohl ein paar zeilen kuerzer sein sollte.
es wuerde imho die lesbarkeit verbessern (und doppelten eintragungen vorbeugen), wenn jemand die aktuelle liste mit der sortierten Benutzer:Lustiger seth/sbl ersetzt. stand der letzten beruecksichtigten aenderungen: 2008-03-11 10:00. -- seth 18:43, 20. Feb. 2008 (CET)Beantworten

nachtrag: falls die sortierung nicht erwuenscht ist, erwarte ich dennoch wenigstens eine begruendung dafuer. -- seth 23:42, 27. Feb. 2008 (CET)Beantworten
haallo echo! -- seth 01:28, 8. Mär. 2008 (CET)Beantworten
Danke, aber anscheinend ist da kein allgemeines Problembewusstsein vorhanden. Mir z.B. ist es relativ egal, da man's sowieso nicht Abschnittsweise bearbeiten kann nehm ich halt die Browsersuche, da ist es dann egal wie's sortiert ist. Gruß, --NoCultureIcons 17:44, 9. Mär. 2008 (CET)Beantworten
bei regulaeren ausdruecken kann die browsersuche auch schon mal versagen (aber ich gebe zu, dass das hier eher selten vorkommen wird und auch eine alphabetische sortierung der (second-level-)domains bei regexp an ihre grenzen stoesst).
mir fiel aber noch was anderes auf, als ich mir gestern noch mal die meta-liste angeschaut hatte. wie ich bereits oben anmerkte, ist die sache mit "will only match inside hosts" falsch. auf der meta-liste werden sogar wortgrenzen (\b) explizit angegeben, da offenbar das verarbeitende script bloss ein teilstringmatch (ohne jegliche anker) durchfuehrt. insofern waere ein vorbeugendes ergaenzen von wortgrenzen sinnvoll. ich hab da mal was vorgebereitet: Benutzer:Lustiger seth/sbl. und als gimmick habe ich die liste sogar nach slds sortiert. ;-) -- seth 10:24, 11. Mär. 2008 (CET)Beantworten

die black-list wird mittels regexps erstellt. vermutlich kennen sich damit aber nicht alle admins aus. waere es somit geschickter, wenn man die liste nicht von jedem einfach so aendern laesst, sondern wenn das nur einer bestimmten gruppe von admins erlaubt wird? dann koennten solche fehler wie sie zurzeit drinstehen, vermieden werden. beispiel:

vorort.bund\.net\suedlicher-oberrhein\ matcht nie, da whitespace (\s) eh abgehackt wird. gemeint waren vermutlich slashes statt backslashes.

ausserdem koennte man im zuge dessen auch endlich sowas einfuehren wie sicherheits-barrieren, dass naemlich eine begruendung zu jedem regexp angegeben werden muss. momenten ist die spamlist naemlich extrem untransparent, da sogar in der zusammenfassung meist keine begruendung angegeben wird und die in der liste selbst angegebenen gruende sehr haeufig aussagelos sind. -- seth 00:06, 10. Apr. 2008 (CEST)Beantworten

zwar wurde jetzt etwas verbessert, aber obiges problem bleibt bestehen. liest ueberhaupt jemand, was ich schreibe? :-) -- seth 22:10, 10. Apr. 2008 (CEST)Beantworten
als ergaenzung: wenn alle urls, die "vorort.bund.net/suedlicher-oberrhein" enthalten, geblockt werden sollen, dann ginge das mit "vorort\.bund\.net/suedlicher-oberrhein". (als zusaetzliche info fuer leute, die sich mit regexp auskennen: das slash muss nicht maskiert werden, weil ausrufezeichen als delimiter verwendet werden.) -- seth 00:53, 12. Apr. 2008 (CEST)Beantworten
Lustiger Osirismörder: so stimmt es doch, oder? sугсго.PEDIA 09:14, 12. Apr. 2008 (CEST)Beantworten
jau, jetzt passt's. der bloede osiris ist aber gar nicht so wirklich gestorben, zumindest nicht permanent. er ist einfach nicht totzukriegen... also vorsicht mit deinen behauptungen. ;-) abgesehen davon ist der, von dem du da sprichst ja eh bloss ein namensvetter. -- seth 12:51, 12. Apr. 2008 (CEST)Beantworten

Sollten wir nicht ein Log wie auf meta führen?: m:Spam blacklist/Log - kürzer wird die Liste nicht, und irgendwann sollten wir auch mal erledigtes (nicht mehr existierende Hosts, Gefahr der Massenverlinkung geht gegen 0 usw.) aufräumen. Ist zwar beim Eintrag eines Links Mehraufwand, erleichtert aber die Nachvollziehbarkeit und hilft beim Aufräumen. --Complex 23:58, 14. Apr. 2008 (CEST)Beantworten

MediaWiki:Spam-blacklist/log - Vorschlag zwecks Verbesserung. (Übersetzung, teilweise Anpassung an etwas angepasst) sугсго.PEDIA 08:55, 15. Apr. 2008 (CEST)Beantworten
ah, sehr cool! damit fallen einige der kritikpunkte der obigen diskussionen flach, wenn ich es richtig verstehe, dass dort alle aenderungen der spamliste dokumentiert und begruendet werden.
zu deiner frage bzgl. auf WP:AN der vorlage: was spricht gegen "/request" statt "spamwunsch", also so wie im original?
kann man das problem loesen, dass durch die diskussionen-archivierung die links der vorlage mit der zeit nicht mehr stimmen werden? -- seth 19:14, 17. Apr. 2008 (CEST)Beantworten
Ja: Wir binden diese Seite in Archiv als Vorlage ein und die Links zeigen direkt aufs Archiv. sугсго 19:28, 17. Apr. 2008 (CEST)Beantworten
hui *staun* -- seth 23:27, 17. Apr. 2008 (CEST)Beantworten

aenderungen am script

Bearbeiten

ich werde mich mit dem developer in verbindung setzen und ihm ein paar vorschlaege zur erweiterung des scripts unterbreiten. bisher:

  1. durch das neue log waere es ja vielleicht moeglich, die dortigen begruendungen im MediaWiki:Spamprotectiontext aufzufuehren.
  2. es sollte die moeglichkeit geben, zu waehlen, ob ein regexp nur auf artikel oder auch auf DSen angewendet wird. dies koennte durch die angabe von parametern fuer jeden einzelnen regexp oder einfach durch zwei getrennte listen geschehen.
  3. durch aufnahme eines regexps in die liste sollten bereits vorhandene urls nicht zu sperren fuehren, sondern nur das hinzufuegen eines indizierten links sollte gesperrt werden.

wenn keine einwaende/ergaenzungsvorschlaege kommen, darf sich hinterher keiner beschweren. ;-p -- seth 23:02, 19. Apr. 2008 (CEST)Beantworten

bugzilla:14090, bugzilla:14091, bugzilla:14092. -- seth 00:09, 14. Mai 2008 (CEST)Beantworten
wow, da waren's nur noch zwei... bugzilla:1505; dritter punkt ist erledigt worden. -- seth 02:06, 14. Mai 2008 (CEST)Beantworten
bugzilla:14091 hat sich eigentlich auch mit bugzilla:1505 groesstenteils erledigt. -- seth 13:44, 21. Mai 2008 (CEST)Beantworten
aus meiner sicht ist 14090 mittlerweile erledigt. -- seth 23:32, 10. Apr. 2009 (CEST)Beantworten

fusion der diskussionsseiten von black- und whitelist

Bearbeiten

da der kram doch sehr zusammenhaengt, schlage ich eine zusammenlegung der beiden diskussionsseiten vor. das waere uebersichtlicher und user-freundlicher. einwaende? -- seth 01:23, 21. Apr. 2008 (CEST)Beantworten

ok, dann mach ich das einfach. -- seth 00:04, 25. Apr. 2008 (CEST)Beantworten

Einführung einer inhaltlichen Regel

Bearbeiten

Erstmal nur an die Mitleser: Die Blacklist ist ja nicht Rechnenzeitneutral, sollte man nicht die Verwendung als Mittel gegen IP-Spam in einzelnen Seiten aufhören? Dieses Problem kann man auch durch eine Halbsperre des fraglichen Artikels umgehen. sугсго 08:08, 4. Mai 2008 (CEST)Beantworten

zur performance stehen ein paar saetze in mw:Extension:SpamBlacklist#Performance. ich weiss nicht, wie hart die black-/whitelists wirklich reinhauen. der riesigen meta-listen wegen vermute ich allerdings, dass die performance wohl nicht so sehr beeintraechtigt wird.
der klar vorhandene nachteil einer artikel-semi-sperre, dass "gute" ip-adressen ausgesperrt werden, entsteht beim nutzen der blacklist nicht. allerdings wird bei der blacklist viel leichter vergessen, den kram auch wieder zu entsperren -> schleichender, nicht so leicht sichtbarer nachteil. wieviele der in die liste aufgenommenen links sind denn wieder rausgenommen worden? vieleicht 5? und das, obwohl mittlerweile einige der adressen sogar tot sind und somit eigentlich kein spamming mehr zu erwarten ist. zeitgesteuertes sperren wie bei den artikel-semi-sperren ist hier (noch) nicht automatisiert moeglich.
eine praktikable loesung waere, wenn hier mehr admins vorbeischauen und die requests abarbeiten und wuerden. WP:VM wird beispielsweise rund um die uhr von admins ueberwacht <wowereit />. hier allerdings kuemmern sich ausser dir und ein paar gaanz wenigen anderen kaum welche um die requests. wuerde sich das aendern und hier mehr bewegung entstehen, koennte man (z.b. anhand des logfiles) alte blacklist-eintraege sukzessive rausloeschen. ggf. werden sie halt spaeter wieder in die liste aufgenommen. solange die blacklist so klein ist, wie jetzt, macht das auch wenig arbeit. und da durch diese permanente entschlackung auch das wachstum der liste sehr stark beschraenkt und irgendwann sehr wahrscheinlich gestoppt werden wuerde, waere das sogar eine dauerhafte loesung. -- seth 12:15, 4. Mai 2008 (CEST)Beantworten
irgendwie habe ich das gefuehl, dass bereits "alle mitleser" geantwortet haben. das thema spamlist scheint tief gefuerchtet/verhasst zu sein. selbst dein trickreicher taeuschungsversuch auf WP:AN wurde offenbar entlarvt und somit knallhart ignoriert (von einem user mal abgesehen, der immerhin einen typo korrigierte). vielleicht ist das der lerneffekt durch die spam-mails mit dem betreff "kein spam!". oder die leute waren zu sehr enttaeuscht, als sie gemerkt hatten, dass sie auf's glatteis gefuehrt worden sind. ;-) -- seth 00:21, 14. Mai 2008 (CEST)Beantworten

Aktuelle Bugzilla-Einträge zur Blacklist

Bearbeiten

Stellungnahmen erwünscht

oje, ich hab's geahnt. das thema wurde ja kuerzlich hier in de-wiki angerissen. imho schafft das mehr huerden fuer OMAs als es wirkungsvoll spam bekaempft.
der spam wird ja auch eigentlich durch die mail ansich ausgemacht, weniger durch einen url innen drin. und wenn OMAs gewarnt werden: "lass einfach das http:// weg, dann geht's", dann koennten spammer diese information natuerlich auch fuer sich nutzen.
ich wurde bereits ein paar mal per e-mail (teilweise wiki-mail, teilweise sind die leute ganz andere, komplizierte wege gegangen) wegen gesperrter links angeschrieben. die leute waren offensichtlich nicht wiki-erfahren genug, einfach diese talk page zu benutzen. wie sollen die erst mit solchen huerden klarkommen? -- seth 10:40, 28. Nov. 2008 (CET)Beantworten

(Ent-)Sperrungen

Bearbeiten

Die Diskussionen wurden auf Einzelseiten verschoben, siehe MediaWiki_Diskussion:Spam-blacklist/Archiv#2008.