Originaldatei (SVG-Datei, Basisgröße: 800 × 400 Pixel, Dateigröße: 396 KB)

Diese Datei und die Informationen unter dem roten Trennstrich werden aus dem zentralen Medienarchiv Wikimedia Commons eingebunden.

Zur Beschreibungsseite auf Commons


Beschreibung

Beschreibung
Deutsch: WineHQ ratings of applications for different wine versions
Datum
Quelle Eigenes Werk
Urheber Laserlicht

Lizenz

Ich, der Urheber dieses Werkes, veröffentliche es unter der folgenden Lizenz:
Creative Commons CC-Zero Diese Datei wird unter der Creative-Commons-Lizenz CC0 1.0 Verzicht auf das Copyright zur Verfügung gestellt.
Die Person, die das Werk mit diesem Dokument verbunden hat, übergibt dieses weltweit der Gemeinfreiheit, indem sie alle Urheberrechte und damit verbundenen weiteren Rechte – im Rahmen der jeweils geltenden gesetzlichen Bestimmungen – aufgibt. Das Werk kann – selbst für kommerzielle Zwecke – kopiert, modifiziert und weiterverteilt werden, ohne hierfür um Erlaubnis bitten zu müssen.

Code to create chart

Execute in Jupyter Notebook. There is sequential execute possible. If something aborts it's possible to resume. Data is written as pickle file for further analysis. Script needs very long to execute (> 5h).

Needs pip librarys: beautifulsoup plotly pandas numpy natsort

import urllib.request
import re
from bs4 import BeautifulSoup
import plotly.express as px
import pandas as pd
import numpy as np
import pickle
import os
from natsort import natsorted, natsort_keygen, ns

url = "https://appdb.winehq.org/objectManager.php?bIsQueue=false&bIsRejected=false&sClass=application&sTitle=Browse+Applications&iItemsPerPage=200&sOrderBy=appName&bAscending=true&sOrderBy=appId&bAscending=true&iPage="
url_version = "https://appdb.winehq.org/objectManager.php?sClass=application&iId="
#
# get pages
#

req = urllib.request.Request(
    url + "1", 
    data=None, 
    headers={
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.47 Safari/537.36'
    }
)

f = urllib.request.urlopen(req)
html = f.read().decode('utf-8')

pages = int(re.search(r'of <b>(\d*)<\/b>', html, re.IGNORECASE).group(1))
pages
#
# get applications
#

applications = None

for i in range(pages):
    req = urllib.request.Request(
        url + str(i+1), 
        data=None, 
        headers={
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.47 Safari/537.36'
        }
    )
    f = urllib.request.urlopen(req)
    html = f.read().decode('utf-8')
    soup = BeautifulSoup(html, "html.parser")
    table = soup.find("table", {"class": "whq-table"})

    if isinstance(applications, pd.DataFrame):
        applications = pd.concat([applications, pd.read_html(table.prettify())[0]])
    else:
        applications = pd.read_html(table.prettify())[0]

pickle.dump(applications, open("wine_applications.pickle", "wb"))
applications
if os.path.isfile("wine_applications.pickle"):
    applications = pickle.load(open("wine_applications.pickle", "rb"))
applications_to_process = applications.iloc[:, 1].values.tolist()
versions = None
#
# get versions
#

if os.path.isfile("wine_versions.pickle"):
    applications_to_process, versions = pickle.load(open("wine_versions.pickle", "rb"))

while len(applications_to_process) > 0:
    req = urllib.request.Request(
        url_version + str(applications_to_process[0]), 
        data=None, 
        headers={
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.47 Safari/537.36'
        }
    )
    f = urllib.request.urlopen(req)
    html = f.read().decode('utf-8')
    soup = BeautifulSoup(html, "html.parser")
    table = soup.find("table", {"class": "whq-table"})

    if table != None:
        df = pd.read_html(table.prettify(), extract_links="body")[0]
        df["AppId"] = applications_to_process[0]

        if isinstance(versions, pd.DataFrame):
            versions = pd.concat([versions, df])
        else:
            versions = df

    applications_to_process.remove(applications_to_process[0])
    
    pickle.dump((applications_to_process, versions), open("wine_versions.pickle", "wb"))

    print("remain: " + str(len(applications_to_process)))
versions_to_process = []
for i in range(versions.shape[0]):
    versions_to_process.append((versions["Version"].tolist()[i][0], versions["Version"].tolist()[i][1], versions["AppId"].tolist()[i]))
tests = None
#
# get tests
#

if os.path.isfile("wine_tests.pickle"):
    versions_to_process, tests = pickle.load(open("wine_tests.pickle", "rb"))

while len(versions_to_process) > 0:
    req = urllib.request.Request(
        versions_to_process[0][1] + "&bShowAll=true", 
        data=None, 
        headers={
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.47 Safari/537.36'
        }
    )
    f = urllib.request.urlopen(req)
    html = f.read().decode('utf-8')
    soup = BeautifulSoup(html, "html.parser")
    table = soup.find("div", id="collapse-tests").find("table", {"class": "whq-table"})

    if table != None:
        df = pd.read_html(table.prettify(), extract_links="body")[0]
        df["Ver"] = versions_to_process[0][0]
        df["AppId"] = versions_to_process[0][2]

        if isinstance(tests, pd.DataFrame):
            tests = pd.concat([tests, df])
        else:
            tests = df
            
    versions_to_process.remove(versions_to_process[0])
    
    pickle.dump((versions_to_process, tests), open("wine_tests.pickle", "wb"))

    print("remain: " + str(len(versions_to_process)))
if os.path.isfile("wine_applications.pickle"):
    applications = pickle.load(open("wine_applications.pickle", "rb"))
if os.path.isfile("wine_versions.pickle"):
    applications_to_process, versions = pickle.load(open("wine_versions.pickle", "rb"))
if os.path.isfile("wine_tests.pickle"):
    versions_to_process, tests = pickle.load(open("wine_tests.pickle", "rb"))
version_no = natsorted([x for x, y in tests["Wine version"].drop_duplicates().tolist() if not "staging" in x and not "rc" in x], alg=ns.IGNORECASE)
version_no
df = pd.DataFrame({"version": version_no})
df
tests_edit = tests.copy()
tests_edit["Wine version"] = [x for x, y in tests_edit["Wine version"]]
tests_edit["Test date"] = [x for x, y in tests_edit["Test date"]]
tests_edit["Rating"] = [x for x, y in tests_edit["Rating"]]
tests_edit
df1 = pd.merge(df, tests_edit, how="left", left_on="version", right_on="Wine version")
df1 = df1[["version", "Test date", "Rating"]]
df1
df2 = pd.pivot_table(df1, index="version", columns="Rating", values="Rating", aggfunc="count").reset_index()
df2 = df2.fillna(0)
df2["Sum"] = df2["Bronze"] + df2["Garbage"] + df2["Gold"] + df2["Platinum"] + df2["Silver"]
df2["Bronze %"] = df2["Bronze"] / df2["Sum"]
df2["Garbage %"] = df2["Garbage"] / df2["Sum"]
df2["Gold %"] = df2["Gold"] / df2["Sum"]
df2["Platinum %"] = df2["Platinum"] / df2["Sum"]
df2["Silver %"] = df2["Silver"] / df2["Sum"]
df2 = df2.replace([np.inf, -np.inf], 0)
df2
df3 = df2.copy()
df3 = df3[["version", "Bronze %", "Garbage %", "Gold %", "Platinum %", "Silver %"]]
df3 = pd.melt(df3, id_vars="version", value_vars=list(df3.columns[1:]))
df3['Rating'] = df3['Rating'].str.replace(' %','')
df3['order'] = df3['Rating'].replace({'Garbage':0, 'Bronze':1, 'Silver':2, 'Gold':3, 'Platinum':4})
df3
fig = px.bar(df3.sort_values(["version", "order"], key=natsort_keygen()), width=800, height=400, x="version", y="value", color="Rating", color_discrete_map={"Garbage": 'rgb(255, 0, 0)', "Bronze": 'rgb(255, 128, 2)', "Silver": 'rgb(255, 255, 0)', "Gold": 'rgb(128, 192, 0)', "Platinum": 'rgb(0, 128, 0)'})
fig.update_layout(bargap=0)
fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(255, 255, 255, 255)',
    'title': dict(text = 'WineHQ ratings of applications for different wine versions', y=0.955),
    'margin': dict( l = 10, r = 10, b = 10, t = 30)
})
fig.update_traces(marker_line_width=0)
fig.update_yaxes(visible=False, showticklabels=False)
fig.update_xaxes(title='Version')
fig.write_image("wine.svg")
fig.show()

Kurzbeschreibungen

Ergänze eine einzeilige Erklärung, was diese Datei darstellt.

In dieser Datei abgebildete Objekte

Motiv

Dateiversionen

Klicke auf einen Zeitpunkt, um diese Version zu laden.

Version vomVorschaubildMaßeBenutzerKommentar
aktuell14:26, 25. Nov. 2023Vorschaubild der Version vom 14:26, 25. Nov. 2023800 × 400 (396 KB)LaserlichtUploaded own work with UploadWizard

Die folgende Seite verwendet diese Datei:

Globale Dateiverwendung

Die nachfolgenden anderen Wikis verwenden diese Datei:

Metadaten