Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Updaten auf neue API #43

Open
looreen opened this issue Oct 18, 2022 · 8 comments
Open

Updaten auf neue API #43

looreen opened this issue Oct 18, 2022 · 8 comments
Assignees
Labels

Comments

@looreen
Copy link
Contributor

looreen commented Oct 18, 2022

Die beiden Grafiken bauen auf Daten im Corona Data Workers Repo auf, die auf einer Virtual Machine laufen, die Steffen gern aussortieren möchte. Daher sollen die auf die neue API plus Spreadsheet umgestellt werden.

https://datawrapper.dwcdn.net/NWcZ8
https://datawrapper.dwcdn.net/XiHIr

@looreen looreen added the MEDIUM label Oct 18, 2022
@looreen looreen self-assigned this Oct 19, 2022
@looreen
Copy link
Contributor Author

looreen commented Oct 19, 2022

Für Bayern unterscheiden sich die Angaben zur Bevölkerung je Altersgruppe leicht im Vergleich zu dem, was in der API hinterlegt ist. Siehe Screenshot: Oben sind die Daten aus der API, unten die aus den Corona Data Workers.
Bildschirmfoto 2022-10-19 um 12 03 44

In den berechneten Inzidenzen kommt es daher zu leichten Verschiebungen: In der Altersgruppe 0 bis 4 für Woche bis 17.10. etwa 153 statt bisher 154. In der Gruppe 60 bis 79 von 1015 auf 1010. Ist das problematisch? @stekhn

@stekhn
Copy link
Member

stekhn commented Oct 19, 2022

Grundsätzlich sehe ich darin kein großes Problem. Ich frage mich aber, woran das liegt. Verwenden wir hier möglicherweise zwei unterschiedliche Bevölkerungsstände? Wenn ja, sollten wir die aktuellen Alterskohorten verwenden. Problematisch wäre, wenn die Unterschiede durch einen Berechnungsfehler zustande kommen.

@looreen
Copy link
Contributor Author

looreen commented Oct 20, 2022

Bildschirmfoto 2022-10-20 um 11 53 28
Es werden unterschiedliche Zeitpunkte der Bevölkerungszahlen verwendet. Michael hat den Stand vom 31.12.2019 benutzt, die Corona API nutzt die vom 31.12.2020. Beide unterscheiden sich naturgemäß zu denen vom 31.12.2021. Ich würde vorschlagen, wir nutzen die der Corona API (2020) und machen ein neues Issue auf, die Bevölkerungszahlen für alle BL, nicht nur Bayern, in der Corona API auf den Stand von 2021 anzupassen. Da können wir dann auch Fragen wie mögliche Verzerrungen berücksichtigen. Passt das für dich @stekhn ?

@stekhn
Copy link
Member

stekhn commented Oct 20, 2022

Das halte ich für eine sinnvolle Lösung. Vielen Dank für die Recherche, @looreen 🙏

@looreen
Copy link
Contributor Author

looreen commented Oct 28, 2022

Hier ist ein Spreadsheet, das direkt auf die Corona API zugreift und die gleichen Daten erarbeiten sollte.
https://docs.google.com/spreadsheets/d/1-UcAl2QuwQSQmvoy2FbsrXfrKmHv6uzxsAnam_u256M/edit#gid=2074220014
Das sollte dieses Problem lösen.
@marco-le Kannst du das Sheet durchgehen und wenn alles passt, den richtigen Link in der Originalgrafik ersetzen?

@marco-le
Copy link
Contributor

marco-le commented Nov 2, 2022

Die Originalgrafik Bayern ist umgestellt. @looreen: Gibt es das auch noch für Deutschland, oder muss das noch erstellt werden?

@looreen
Copy link
Contributor Author

looreen commented Nov 2, 2022 via email

@looreen
Copy link
Contributor Author

looreen commented Nov 8, 2022

Ich hab in dem gleichen Spreadsheet ein äquivalentes Spreadsheet für Deutschland erstellt und den Link in Datawrapper geändert. Damit sollten die Grafiken fertig sein und keine mehr auf die Dataworkers zugreifen.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants