Benutzer Diskussion:Stefan Kühn/Check Wikipedia/Archiv/2008/Nov

Ganz praktische Erfindung auf der Spezial:Doppelte Weiterleitungen ist der direkte Ändern-Button, damit man nicht erst warten muss, bis der Artikel angezeigt wird, ehe man auf Seite bearbeiten klickt. Fänds cool wenn sowas hier auch eingebaut wird, geht dann ein wenig schneller :) --Suicidefury 00:13, 8. Nov. 2008 (CET)

Gute Idee, ich probier das mal einzubauen. -- sk 20:16, 9. Nov. 2008 (CET)

Ruwiki <ref> check - 2

Can you please add {{Примечания}}, {{Список примечаний}} and {{список примечаний}} as synonyms to <references />? --81.30.188.21 15:45, 8. Nov. 2008 (CET)

 Ok. -- sk 22:19, 8. Nov. 2008 (CET)
Thanks! --81.30.188.21 18:51, 9. Nov. 2008 (CET)

Show error when transcluding non existing page

You have done a very good tool! I would like it to flag an error when an article uses {{}} to transclude a non-existing template. Best regards, Alpertron 22:10, 11. Nov. 2008 (CET)

Thanks. If I understand you right: You want that my script find articles where a template is include, which don´t exist? Hmm. I think this is not possible with my script, because therefore I need a list with all existing templates (in this moment). I think this error is better for a special-page or so. With my dump scan is this not possible. -- sk 22:50, 11. Nov. 2008 (CET)
Thanks for considering it. I thought that it was possible to check whether the file exists when your script finds the braces. Also notice that not all transclusions occur from the Template namespace. Best regards, Alpertron 12:42, 12. Nov. 2008 (CET)
Which transclusion is not from the Template namespace? Please examples! -- sk 14:07, 12. Nov. 2008 (CET)
For example, en:Pathology, where you can see {{:History of pathology}}, but there are more examples that I've seen but I do not remember at this time. Best regards, --Alpertron 16:29, 12. Nov. 2008 (CET)
See bugzilla:16024. The new specialpage is Special:WantedTemplates --Der Umherirrende 18:02, 12. Nov. 2008 (CET)
Thanks, I found it. I think it would be useful to link to that page from the output of your tool. Best regards, Alpertron 19:27, 12. Nov. 2008 (CET)

Zwei Fragen

Hi!

  1. Ich würd gerne wissen, wo ich rausfinden kann, nach welchen Fehlern das Skript sucht. Auf der Projektseite werden ja nur Kategorien gelistet, in denen auch Fehler gefunden wurden. Konkret würde ich gerne wissen, ob auch nach Ebene-1-Überschriften (= Überschrift =) gesucht wird.
  2. Warum haben eigentlich die Kategorien "Überschriften beginnen mit drei „=“" und "Überschriftenstruktur fehlerhaft" unterschiedliche Prioritäten? Die erste ist ja nur ein Spezialfall der anderen. Eine Ebene-1-Überschrift, den Titel, gibt's ja in jedem Artikel.

--BerntieDisk. 22:04, 12. Nov. 2008 (CET)

Zu 1: Auf der Übersetzungsseite sind alle fehler aufgelistet. Der Umherirrende 14:47, 16. Nov. 2008 (CET)

Frwiki <ref> check

Please for French wiki consider {{Notes}} and {{Références}} as synonyms to <references />. Thanks ! --66.131.214.76 04:11, 19. Nov. 2008 (CET)

 Ok. -- sk 22:05, 19. Nov. 2008 (CET)
Danke --66.131.214.76 02:28, 20. Nov. 2008 (CET)

Nicht alle Artikel gescannt?

Mir ist jetzt schon öfters aufgefallen, dass ich Fehler in Artikel korrigiere, und dass es dort noch andere Fehler gibt, die aber nicht in der Liste aufgeführt werden, z.B. Jugendmusik Lackenbach. Er tauchte in der Liste für Fehler 7 (Überschriften beginnen mit drei „=“) auf, aber nicht bei Fehler 30 (Bildunterschrift fehlt). Außerdem finde ich noch diverse Zeilenumbruch-Fehler, die eigentlich hätten erkannt werden müssen. Woran kann das liegen? --STBR!? 18:10, 19. Nov. 2008 (CET)

Am besten ist es immer, wenn du in der Komplett-Liste nachschaust, welche Fehler für den Artikel erkannt wurden. Bei "Jugendmusik Lackenbach" steht da derzeit nur der Fehler 7. Also wird von meinem Skript kein weitere Fehler dort erkannt, was nicht heißt, dass es dort keine gibt. Manchmal werden einige andere Fehlerarten in der Ausgabe für Wikipedia nicht angezeigt, weil durch die Begrenzung auf 200 Fehler pro Rubrik die anderen Fehler nicht mit dargestellt werden. - Die Fehlererkennung im Skript ist möglichst robust ausgelegt, weil es ja für viele Sprachen angewendet werden soll. Bei der Bildunterschrift hab ich mich derzeit selbst begrenzt auf Bilder die mit "...px" enden und davor eine dreistellige Zahl haben, also z.B. "123px". Da kamen schon so viele Fehler zusammen, dass ich es erstmal dabei belassen habe. Wenn ich zu viele erkenne, kann ich auch nicht mehr ein tägliches Update für alle Sprachen ermöglichen (zumindestens bei jetziger Arbeitsweise), weil das Scannen der Artikel in allen Sprachen derzeit gut 25 Stunden in Anspruch nimmt. Du kannst mir aber liebend gern jeden Fehler melden, den du entdeckst. Wir können auch gerne eine Liste anlegen von Fehlern, die in Zukunft erkannt werden sollen. - Wegen der genauen Arbeitsweise, schau am besten mal in das Perl-Skript z.B. suche mal nach "sub error_030", da kannst du sehen wie das Skript genau arbeitet. - Was meinst du genau mit Zeilenumbruch-Fehlern? Falsch br? Oder was anderes? Ich filter derzeit nur wirklich richtig massiv falsche "br" heraus. Sonst sprengt es auch die Anzahl. - Ansonsten noch großes Lob für dein fleißiges Abarbeiten. -- sk 22:20, 19. Nov. 2008 (CET)
Hmmm, also so wie ich das gerade verstanden habe, erscheint ein Artikel nur in der ersten Fehlerkategorie, für die ein Fehler gefunden wurde, auch wenn er mehrere enthält. Mit Zeilenumbrüche meine ich noch diverse /br-Konstruktionen, die mir immer mal wieder unterkommen. Aber wenn das Verhalten des Scripts so ist, wie ich es gerade geschildert habe, wäre das natürlich klar, warum das so ist. Aber was ist z.B. mit Martin Truex Jr.: In der Infobox ist ein Bild eingebunden, das bis gestern noch keine Bildbeschreibung enthielt. Ansonsten dürfte der eigentlich fehlerfrei sein (kann mich aber auch irren, ist aber eher unwahrscheinlich), aber in der Fehlerliste tauchte er nicht auf? --STBR!? 08:27, 20. Nov. 2008 (CET)
Nicht ganz. Also derzeit scannt das Skript jeden fehlerhaften Artikel einmal pro Tag. Dann schnappt es sich alle von einer Fehlerkategorie und gibt nur 200 aus. Das heißt der Fehler kann zwar erkannt worden sein, aber muss nicht unbedingt unter den 200 Auserwählten sein. Bei Mr. Truex war es ein doppelter Sonderfall. Ersten hätte mein Skript derzeit das Konstrukt [[Bild:MartinTruexJrAugust2007.jpg|150px|]] durch den Pipe nach "px" als nicht fehlerhaft erkannt, weil nach ...px]] gesucht wird und zweitens klammere ich derzeit vor der Fehlerüberprüfung die Vorlagen, Tabellen, "pre", "source" "math" und anderes komplett aus. Die Vorlagen will ich in nächster Zeit komplett auflösen und dann für weitere Fehlerbegutachtungen heranziehen. -- sk 08:47, 20. Nov. 2008 (CET)
Ach so... Aber dann muss ich nochmal auf den oben genannten Artikel Jugendmusik Lackenbach zurückkommen: Da ja aktuell nur noch 9 fehlende Bildbeschreibungen offen sind, hätte der Artikel in dieser Fehlerliste doch zusätzlich auftauchen müssen, oder sehe ich das falsch? Immerhin war das Bild schon länger ohne Bildbeschreibung eingebunden. --STBR!? 09:01, 20. Nov. 2008 (CET)
Wie gesagt, derzeit wird nur nach ...px]] gesucht. In "Jugendmusik Lackenbach" stand aber ...thumb]]. Das wird nicht gefunden derzeit. -- sk 09:08, 20. Nov. 2008 (CET)
Ahhh, jetzt hab ich's verstanden. :) --STBR!? 09:09, 20. Nov. 2008 (CET)

Syntax error for redirects

Hello! First of all, thank you for the syntax checker tool! Maybe you have already thought of this, but I do not find it anywhere. At svwiki_p I found some faulty redirects today. They looked like this: #REDIRECT = [[Target page]], i.e. with an equal sign after the redirect statement. Maybe the tool should also look for #REDIRECT with other characters than whitespace before [[ or something like that? (Not case sensitive, of course.) --MagnusA 08:00, 20. Nov. 2008 (CET)

Thanks for this info. I will include this error. -- sk 08:48, 20. Nov. 2008 (CET)
 Ok. -- sk 21:05, 20. Nov. 2008 (CET)
This feature may have a bug? Error reports are all related to Image syntax. ja:User:fryed-peach 17:02, 21. Nov. 2008 (CET)
Yes, it shows images in gallerys without description. I will fix this tonight. ;-) -- sk 17:05, 21. Nov. 2008 (CET)
 Ok -- sk 21:25, 21. Nov. 2008 (CET)

Bug report - dawiki: da:Fortsættelseskrigen

There seem to be a problem counting [[ ]] correctly, when there are other elements inside the square brackets. The segment below looks well-formed to me, but the page is still included in the list of pages with mismatched square brackets.


[[Image:DeadFinnishcivilians1942.jpg|right|thumb|300px|Finske civile dræbt af sovjetiske partisaner i Seitajärvi i finsk Lapland 1942<ref>{{cite web
|url=http://www.hs.fi/english/article/Too+awful+an+image+of+war/1135223124092
|title=Sixty years on, there are no grounds to withhold images kept in a Finnish Defence Forces' safe
|accessdate=2008-01-17
|author=Anna-Stina Nykänen 
|last=
|first=
|authorlink=
|coauthors=
|date=2006-11-19
|work=Too awful an image of war
|publisher=HELSINGIN SANOMAT (International Edition)
|pages=
|language=
|doi=
|archiveurl=
|archivedate=
|quote=De halvnøgne lig af finske kvinder og børn ligger strøet på jorden, deres lig halvt opløst. Liget af en lyshåret dreng på omkring 5 år er lagt på ladet af en lastbil. En finsk soldat holder de brændte og svedne lig af et spædbarn i sine arme. </br>
En anden konvolut viser billeder af kannibalisme. Russiske tropper, omringet af finner og uden håb om undsætning, er begyndt at spise deres døde. En tredje konvolut indeholder anskuelige billeder af henrettelser. En russisk infiltrator, fanget bag de finske linjer, smiler og ler til kameraet mens en finsk officer retter en pistol mod ham for at henrette ham.}}</ref>]]

Could you please take a look at this? -- da:User:Wegge 09:14, 21. Nov. 2008 (CET)

Hello Wegge. The problem is only that between the open end close square brackets is a line break. I have never see something like this construction in a link or image. In all 97.687 articles of da and in all 828.748 articles of de and all 497.680 articles of nl my script found only this one article in da with this problem. If we delete the line breaks it is also not a problem. What do you mean? -- sk 21:40, 21. Nov. 2008 (CET)
If it's only the <br /> tag that's the problem, I think we can live with that. -- da:User:Wegge 21:42, 21. Nov. 2008 (CET)
No it is not the "br". The reason are the line breakes in the template "cite web". But I have a solution for this problem. At the moment I not exlude the templates. I will this include in my script in the next time, but the problem is very complex. If you can wait a little bit, I will solve the problem. Thanks for your bug report. -- sk 21:54, 21. Nov. 2008 (CET)

HTML-Textformatierungselemente

Diese Rubrik zeigt Seiten mit <big>, aber in der Überschrift steht nicht drin, das dies unerwünscht sein. Eine Möglichkeit dies in MediaWiki darzustellen gibt es nicht. Beschreibung oder Skript anpassen? Der Umherirrende 21:31, 21. Nov. 2008 (CET)

Also laut Hilfe:Textgestaltung soll es nicht in normalen Artikeln verwendet werden. Wäre noch zu klären, was ein "normaler" Artikel ist. -- sk 21:42, 21. Nov. 2008 (CET)
Stimmt, da habe ich nicht dran gedacht. Ich weiß auch nicht was als normal angesehen werden kann. Aber würde dies erstmal hintenanstellen, da die Rubrik ja erstmal genug fehler hat, vielleicht wird sie dann auch schneller abgearbeitet. Der Umherirrende 21:46, 21. Nov. 2008 (CET)

Fehler 34 - Template programming element

Hallo Stefan!

Könntest du dir mal die Artikel Bleidistearat und Zinkstearat anschauen, wie man dort die Template-Elemente für Tabellen aus den Infoboxen bekommen kann? --STBR!? 08:48, 18. Nov. 2008 (CET)

Mein Skript findet dort die drei geschweiften Klammern und denkt das ist Template-Code. Ich aber leider nicht, ob man das da anders schreiben kann. Bin in Chemie immer schlecht gewesen und möchte dort nix verändern. Ist sicher was für die Profis in der Vorlagenwerkstatt. -- sk 10:49, 18. Nov. 2008 (CET)
beides ist bereits behoben: Bleidistearat, Zinstearat. Was mir nur aufgefallen ist, das in der Übersetzung steht, das auch PAGENAME und ähnliches erkannt wird. Dies scheint aber nicht in Parameterwerten zu passieren, sondern nur außerhalb der Vorlagen. Diese Form wird oft verwendet (Beispiel). Der Umherirrende 16:12, 22. Nov. 2008 (CET)

fortführende Listen

Derzeit scheinen die ol mit einer start-Angabe nicht als Fehler anerkannt zu werden. Auf Hilfe:Listen ist aber erklärt, das man es änders machen sollte (letzte Zeile). (Ist mir hier aufgefallen) Vielleicht kann man es mit aufnehmen und die Beschreibung um diese Ersetzungsregel ergänzen. Der Umherirrende 22:54, 21. Nov. 2008 (CET)

Interessant. Das wusste ich noch nicht das es auch so geht. Wenn es sowas wie SelfHTML auf englisch geben würde, dann könnte man dadrauf verweisen. Am besten wäre eine Empfehlung vom W3-Consortium. --sk 09:09, 22. Nov. 2008 (CET)
http://en.selfhtml.org ist eingestellt, aber ich glaube dort würde auch nichts stehen, das ist eher eine MediaWiki Besonderheit, das dies erkannt vom Parser erkannt wird und entsprechend in HTML umgestetzt wird. Wurde unter Hilfe Diskussion:Listen#Zählung ab bestimmter Zahl erläutert. Auf meta:Help:List#Specifying a starting value wird das hier genannte Vorgehen auch nicht erläutert, sollte man das dort ergänzen und dann verlinken? Der Umherirrende 13:30, 22. Nov. 2008 (CET)

Artikel fängt mit Weißraum an

MediaWiki entfernt am Aritkelanfang Zeilenumbrüche, wenn aber dort ein Leerzeichen steht, werden die Zeilenumbrüche nicht entfernt, dies kann nach entfernen von LA oder ähnlichen Bausteinen passieren. Beispiel, dadurch entsteht ein unnötiger Weißraum am Anfang. Es können auch Leerzeichen ohne Umbrüche am Artikelanfang vorhanden sein. Ich halte es für sinnvoll dieses zu bereinigen. Der Umherirrende 23:01, 21. Nov. 2008 (CET)

Ja, ich bin deiner Meinung. Jeder Artikel sollte sauber mit der ersten Zeile anfangen. Mal schauen was sich da machen lässt. Wichtiger sind mir erstmal die Templates, die ich ordentlich rausextrahieren möchte, so wie ich das schonmal für den Templatetiger gemacht habe. Also bitte etwas Geduld. :-) Aber melde mir ruhig immer hier deine Einfälle. -- sk 09:12, 22. Nov. 2008 (CET)
Kein Problem, so lange es nicht vergessen wird ;) Wenn mir was einfällt, schreibe ich die Ideen weiter hier auf, dann kann schonmal drüber diskutiert werden etc., kannst dir ja dann immer etwas herraussuchen. Die Umsetzbarkeit muss du ja selber entscheiden, daher möchte ich auch nichts aufdrängen. Ansonten hast du schon gute Arbeit geleistet. Der Umherirrende 13:17, 22. Nov. 2008 (CET)

Comment not correct end

Wenn die Zeichensequenz <!-- als nowiki (<nowiki><!--</nowiki>) markiert ist, sollte sie vom Check ausgeschlossen werden. Siehe en:Wikipedia:Votes for deletion/Union County Magnet High School (<!-- Being the author of that comment,…) --Manoridius 20:49, 22. Nov. 2008 (CET)

Das ist eine ziehmlich kritische Geschichte. Ich weiß nicht wie genau der Artikel bei diesem Problem geparst werden sollte. Ich streiche zuerst alle Kommentare aus dem Artikel, dann alle Nowikis und dann alle pre ...! Das hat bisher auch sehr gut funktioniert. Aber ich habe noch keine Info gefunden, wo steht das nicht vielleicht doch zuerst nowiki und dann die Kommentare geparst werden. Je nach dem, welchen Teil man zuerst parst, wirkt sich das auf den Rest dann aus. Das ist ein großes noch ungeklärtes Problem. -- sk 09:54, 23. Nov. 2008 (CET)
Quelltext Anzeige
<!--comment-->
<nowiki><!--comment--></nowiki> <!--comment-->
<nowiki><!--</nowiki> <!--
<nowiki>nowiki</nowiki> nowiki
<nowiki><nowiki></nowiki> <nowiki>
<!--<nowiki>nowiki</nowiki>-->
Hm, ich würde davon ausgehen, dass die verschiedenen Tags gleichwertig sind und daher von links nach rechts abgearbeitet werden sollten. In der Tabelle rechts habe ich dies mal getestet.
Nach diesem Test werden die Tags effektiv sequentiell von links nach rechts abgearbeitet. Ich habe jedoch keine Angaben gefunden, ob dies immer gilt. --Manoridius 22:25, 24. Nov. 2008 (CET)
Danke für deine Hilfe. Da werde ich am Wochenende mal etwas umprogrammieren, damit die seltenen Sonderfälle auch mit ordentlich durchgehen. -- sk 22:28, 24. Nov. 2008 (CET)

Kleinigkeiten

Ich hätte da zwei Vorschläge für die Prüfung mit dem Script:

  • kein Satzzeichen innerhalb eines Titels: siehe Wikipedia:Format#Grundregeln
  • keine Leerzeichen / Leerzeilen zur Formatierung
    Daher keine zwei oder mehr Leerzeichen / Leerzeilen zwischen anderen Textelementen.

Beim zweiten Punkt bin ich mir nicht sicher, ob es nicht doch sinnvolle Anwendungen gibt. Ich habe auch keine entsprechende Regelung gefunden. Für einen entsprechenden Link (Regel oder sinnvolles Beispiel) wäre ich dankbar!

Gibt es irgendwo eine Übersicht, welche Fehler das Script prüft? Gruss --CHNB 08:33, 25. Nov. 2008 (CET)

Zu der Fehlerübersicht schau mal hier: Wikipedia Diskussion:WikiProject Check Wikipedia#Fragen, Fragen, Fragen.... Ich will demnächst mal eine ordentliche Übersicht erstellen. - zu 1) Kannst du mir ein paar Beispiele geben. zu 2) Das hab ich auch schon überlegt. Gerade die Leerzeilen am Anfang eines Artikels können problemlos weg und dazwischen kann man auch einiges wegnehmen. Da aber z.B. gerade in der niederländischen Wikipedia eine Löschdiskussion im Gange ist, möchte ich die nicht mir solchen Kleinigkeiten anheizen. Ich schreib es mal auf meine to-do-Liste. -- sk 09:11, 25. Nov. 2008 (CET)
Beispiel Doppelpunkte im Titel: [1]. Aufgrund dessen habe ich mal nach der Regelung gesucht und bin auf Wikipedia:Format#Grundregeln gestossen:
Überschriften sollten kurz sein und nicht aus ganzen Sätzen bestehen. Satzzeichen wie der Doppelpunkt und das Ausrufezeichen sind in Überschriften fehl am Platz. Auch Links haben dort nichts verloren. Weiterführende Stichworte sollten im folgenden Absatz im Fließtext verlinkt werden.
Falls Du die Checks in Dein Script integrierst, würde ich die Klasse "Niedrige Priorität" vorschlagen... --CHNB 09:40, 25. Nov. 2008 (CET)
Das Problem ist aber, das das kein globaler Konsens ist. In EN oder FR kann das ganz anders sein. Da muss man vorsichtig vorgehen und darf den Sprachen nichts aufzwängen. Ich könnte mir eine individuelle Behandlung für de zwar vorstellen und bei einem Fehler mache ich das ja schon so, aber generell sollten eigentlich alle davon profitieren. Ich werde erstmal meine Fehlerübersicht bauen und dann schauen wir mal weiter.-- sk 10:01, 25. Nov. 2008 (CET)

False positives in <references /> check

Hi, in French wiki, section on missing <references /> reports articles that comprise parameterized templates like "{{ Références | colonnes = 2 }}". This is a variant of {{Références}} that is equivalent to <references />. It would be nice if you could skip those articles. Thanks, Check Wikipedia is a great tool ! --66.131.214.76 16:11, 22. Nov. 2008 (CET)

Can you give me an example? I search for "{{Références" and maybe only the space is the problem like: "{{ Références". -- sk 09:47, 23. Nov. 2008 (CET)
For example, Auguste got reported despite {{ Références | colonnes = 1 }}; similar cases in Camènes or Coriolan and at least 20 others. You are right, all these cases have spaces before the template keyword. I hope you can fix that. Thanks ! --66.131.214.76 00:29, 24. Nov. 2008 (CET)
Yes, this is the problem. I will fix it. At them moment I search only for the text {{Références. I will change this and use a regulare expression. -- sk 09:24, 24. Nov. 2008 (CET)
 Ok. -- sk 22:26, 24. Nov. 2008 (CET)
It worked fine ! Thanks again --66.131.214.76 23:10, 25. Nov. 2008 (CET) -- dixit LaddΩ parlons! ;)

aliase für magicwords

MediaWiki erlaubt es, vieles zu lokalisieren, also in der jeweiligen Sprache des Wikis anzuzeigen. Neben den Systemnachrichten können auch die magicwords lokalisiert werden. Das Alias führt dann die gleiche Funktion aus, wie das eigentliche Wort der Software. Über eine API-Abfrage sind diese Aliase verfügbar. Dabei habe ich gesehen, das für das normale DEFAULTSORT: auch die Aliase DEFAULTSORTKEY: und DEFAULTCATEGORYSORT vorgesehen sind. Diese Aliase sollten auch auf das Vorhandensein von nicht erlaubten Zeichen durchsucht werden. Die Information case-sensitive könnte man vielleicht auch benutzen, um die kleingeschriebenden Aliase zufinden und hier aufzulisten (Beispiel). Bei der russischsprachige Wikipedia kann man es gut sehen, das sie viele Aliase verwenden. Diese sollten auch berücksichtigt werden. Ich weiß nicht, wie weit du dies berücksichtigt, daher teile ich es hier einmal mit. Ich weiß auch nicht, ob die Informationen auf dem Toolserver direkt verfügbar sind. Der Umherirrende 14:46, 16. Nov. 2008 (CET)

Interessant. Schau ich mir mal in den nächsten Tagen genauer an. -- sk 09:41, 27. Nov. 2008 (CET)

In diesem Abschnitt sollten Aufzählungspunkte (*, nicht #) für die Weblinks verwendet werden, oft steht dort aber nur ein oder mehrere Weblinks ohne Aufzählungszeichen. Hierbei ist nur zu beachten, das einige Vorlagen keine Aufzählungspunkte brauchen, also nur reine Weblinks beachtet werden sollten. Der Umherirrende 21:21, 26. Nov. 2008 (CET)

Ich schreibe es mir mal auf die To-do-Liste. Die ist aber schon recht lang. :-) -- sk 09:55, 27. Nov. 2008 (CET)
Kein Problem. Alles nacheinander und langsam ernährt sich das Eichhörnchen ;-) Sollen ja nur Ideen sein, aber wenn ich sie jetzt nicht aufschreiben würde, würde ich sie auch wieder vergessen/verlegen/verdrängen. Der Umherirrende 11:00, 29. Nov. 2008 (CET)

Unexplained bracket imbalance

Hi, it's Laddo again. In French wiki we have this article that causes 5 detections of imbalanced square brackets. For weeks now, no one was able to identify the exact source of the problem, but we suspect that it is because there is too much distance between the left and right brackets. This article comprises multiple occurrences of the following form:

[[Image:<doc name>|upright=2|thumb|center|<description><ref>long reference</ref><long coloring legend>]]

As a result, there may be more than 300 caracters separating [[ from ]]. Is there a limit to the distance for searching for a right bracket or are we missing the real problem ? Note that the first detection is an unbalanced right double bracket that we cannot explain:

Travail des enfants 0x[[ 1x]] ...
Travail des enfants 1x[[ 0x]] |[[Image:Carte de ratification des conventions 138 et 182.png|upright=2|thumb|center|Pays ayant ratifié...
Travail des enfants 0x[[ 1x]] {{légende|#b9b9b9|Aucune donnée / pays non membre de l'OIT}}]]...
Travail des enfants 1x[[ 0x]] [[Image:Child labour distribution chart.png|550px|thumb|center|Distribution du travail des enfants par...
Travail des enfants 0x[[ 1x]] ...

This is a tough one, I hope you can help. Thanks! --66.131.214.76 16:19, 29. Nov. 2008 (CET) -- dixit LaddΩ parlons! ;)

Hello, Laddo. See also #Bug report - dawiki: da:Fortsættelseskrigen - The problem is the linebracke between [[ and ]]. I work at this problem. -- sk 17:28, 29. Nov. 2008 (CET)
Super, we'll wait, no problem. Thanks again! --66.131.214.76 23:58, 29. Nov. 2008 (CET) -- dixit LaddΩ parlons! ;)

Few bugreports (pl.wiki)

  1. pl:Skale instrumentów muzycznych - your script found many errors with [[]] braces; right, but they're in <timeline> element, and they seem to be needed (I tried deleting them, the timeline image disappeared).
  2. pl:Pomoc:Znaczniki#Znaczniki_do_podmiany - your script found there unclosed <pre>, what is also right; but this pre is in <nowiki> element.

Conclusion: do not look for errors in elements like these, and probably few more (<pre>, for example). Matma Rex 13:18, 30. Nov. 2008 (CET)

Hello Matma Rex, I will exclude the timeline in the future (but this need a little bit time). - Ok, I will also exclude in the future the pre element. Thanks for this information. --sk 13:38, 30. Nov. 2008 (CET)
And <nowiki>, too. You seem to forgot about it. Matma Rex 14:11, 30. Nov. 2008 (CET)
Oups, I think this is a other problem. But I work at this problem. -- sk 14:18, 30. Nov. 2008 (CET)

Too many detections for <big>

Hi Stefan, the detection of <big> in section on HTML text formatting results in too many detections (multiple thousands) that are difficult to resolve : there are no good alternatives to using <big> except for math formulae or misformatted section titles. I suggest that you either skip such detection, or suggest an alternative to using <big>, or separate these detections in a distinct section dedicated to <big>. Any other suggestion for resolving those errors ? Thanks --66.131.214.76 15:40, 29. Nov. 2008 (CET) -- dixit LaddΩ parlons! ;)

In de we can solve this problem with a normal template. For example we need a good template for music-charts in de. I think also in fr and other languages is this the best way. Many formatting things we don't need. For example in fr:Chennegy. Other need a normal template, for example fr:Centre d'études et de recherches internationales. Inside the text we need no formatting things. It is a part of the stylesheet and not of the data. -- sk 21:21, 29. Nov. 2008 (CET)
OK you are right in most cases. I will try further. I saw many cases like fr:Baetis alternata that I do not know how to resolve, but indeed many others can be addressed. --66.131.214.76 00:14, 30. Nov. 2008 (CET) -- dixit LaddΩ parlons! ;)
Did you test it in fr:Baetis alternata without big? I see the symbol ♂ in Mann without big. It's look very well. -- sk 09:33, 30. Nov. 2008 (CET)
I guess the author of fr:Baetis alternata preferred a bigger symbol... standard/big/bigger/biggest is ♂///... I will leave it as is for now  ;) merci --66.131.214.76 03:41, 2. Dez. 2008 (CET) -- dixit LaddΩ parlons! ;)

Ptwiki <ref> but no <references />

Hi. In PTwiki we usually use a template ref-section for the reference section instead of the code. This causes your script to detect a huge ammount of false positives. Is there anything that can be done? Thanks and congrats on the great job. GoEThe 15:39, 30. Nov. 2008 (CET)

 Ok, I include "ref-section" in my script. Thanks for this info. With the next scan tomorrow, you see the result. -- sk 15:43, 30. Nov. 2008 (CET)
Thanks. Also reflist, please. GoEThe 15:45, 30. Nov. 2008 (CET)
Still no change in the ammount of detections. Its alright if you haven't implemented it yet, just to let you know that if you did implement it, it is not working. Cheers. GoEThe 14:35, 2. Dez. 2008 (CET)
 Ok, it was my mistake. -- sk 21:26, 2. Dez. 2008 (CET)

Articles with Category in english not detected

Hello, another one in French Wiki: there seem to be some articles using [[Category:]] that do not get detected, for some reason, like Alexandre Blain, Animal Logic or Drin. Merci ;) --66.131.214.76 20:02, 30. Nov. 2008 (CET) -- dixit LaddΩ parlons! ;)

I know this this. It is a bug, but I have not found the error in my script yet. -- sk 21:27, 2. Dez. 2008 (CET)