user:Distelfinck/WikiProjekt Kennzeichnung     

Wiki labels ist der Name einer Softwaresuite. Das dazugehörige WikiProjekt für die deutschsprachige Wikipedia heißt WikiProjekt Kennzeichnung. In diesem WikiProjekt erstellen wir Datensätze indem wir zuvor ausgewählte Edits und anderes Ausgewähltes in der Wikipedia mit bestimmten Kennzeichnungen versehen. Ein Beispiel: Es wird, zum Zweck ihren Bot zu trainieren, von Entwicklern eine Stichprobe von Edits an uns geliefert, diese kennzeichnen wir dann mit jeweils "Vandalismus" oder "Kein Vandalismus"; die entstandenen Daten trainieren dann den Bot, selbstständig Vandalismus zu finden. Eine angebrachte Kennzeichnung heißt auf englisch „Label“, daher der internationale Name Wiki labels für das Oberprojekt von dem unser WikiProjekt ein Teil ist. Die Softwaresuite ist dazu da diese Kennzeichnungsarbeit einfacher zu machen. The name can be interpreted either as a noun

We work together on Wikipedia to produce wiki labels for important data.

or as a verb (similar to “Wiki loves …”)

In order to get the data we need, wiki labels edit quality.

Goals & Scope

Bearbeiten
 
Labels logo

Our goal in this project is to produce labeled datasets for pressing needs of the Wikipedia community. Labeled datasets have a variety of uses including research (e.g. qualitative analyses of newcomer quality[1] and editor interactions[2]) and the development of advance wiki tools (e.g. the models used by en:User:ClueBot NG and en:WP:STiki). Generally, gathering these types of datasets is difficult as it requires substantial investment of time and effort by a small group of people to “hand-code a suitably large dataset.

We are concerned with (1) identifying opportunities to produce important labeled datasets, (2) distributing the work as broadly as possible and (3) making it easy and efficient to “hand-code”" large datasets. See our list of campaigns for what we’re up to recently. If you would like to help out, sign the member list. If you have an idea for a labeled dataset you’d like to produce, inquire on the talk page.

Wie kann ich helfen?

Bearbeiten

Es gibt ein paar Arten auf die du zu diesem Projekt beitragen kannst.

Kennzeichnen
Bei diesem Projekt dreht sich alles darum, Artefakte in Wikipedia mit Kennzeichnungen zu bekleben. Für die meisten Kennzeichnungskampagnen ist es nötig, eine sehr große Zahl an Proben zu kennzeichnen, bevor uns der jeweilige Datensatz einen Nutzen bringt. Eines der Ziele dieses Projekts ist es also, diese Art von Arbeit am effektivsten auf die Leute zu verteilen. Falls du Interesse hast, mitzumachen, trage dich in die Liste der Teilnehmer ein.
Programmieren
Bugs beheben, neue Features implementieren, die Performanz des Systems erhöhen. Pull-Requests sind willkommen! Siehe das Repo.
Verwalten
Kampagnen laden, mit Systemproblemen umgehen und Neuen helfen, mit der Kennzeichnungsarbeit zu beginnen. Falls du interessiert daran bist, bei der Hausmeisterarbeit von WP:Kennzeichnung oder von Wiki labels, dem Oberprojekt hinter WP:Kennzeichnung, zu helfen, kontaktiere EpochFail (auf Englisch) oder He7d3r (auf Portugiesisch oder Englisch).

Partnering projects

Bearbeiten

Revision scoring as a service

Bearbeiten

Siehe: m:Research:Revision scoring as a service und m:Research:Revision scoring as a service/ORES

 
Revision scoring logo

Many of Wikipedia’s most powerful tools rely on machine classification of edit quality. In this project, we’ll construct a public queryable API of machine classified scores for revisions. It’s our belief that by providing such a service, we would make it much easier to build new powerful wiki tools and extend current tools to new wikis. In order to build powerful machine classifiers, we must start with high quality labeled data. That’s where Wiki labels comes in. See user:Distelfinck/WikiProjekt Kennzeichnung/Edit quality.

 
ORES logo

The primary way that wiki tool developers will take advantage of this project is via a restful web service and scoring system we call ORES (Objective revision evaluation service). ORES provides a web service that will generate scores for revisions on request. For example, enwiki models revertet asks for the score of the “reverted” model for revision #34854258 in English Wikipedia.

Nachweise

Bearbeiten
  1. Halfaker, A., Geiger, R. S., Morgan, J. T., & Riedl, J. (2012). The rise and decline of an open collaboration system: How Wikipedia’s reaction to popularity is causing its decline. American Behavioral Scientist, 0002764212469365. summary full paper
  2. m:Grants:IEG/Editor_Interaction_Data_Extraction_and_Visualization