From 22986ccca28dc90b447e3609b31a6df103fb89ec Mon Sep 17 00:00:00 2001 From: Fabrizio Damicelli Date: Sat, 4 Nov 2023 18:46:41 +0100 Subject: [PATCH] finalize de_ch_4_part2 --- chapters/de/chapter4/4.mdx | 54 +++++++------- chapters/de/chapter4/5.mdx | 8 +- chapters/de/chapter4/6.mdx | 149 +++++++++++++++++++------------------ 3 files changed, 108 insertions(+), 103 deletions(-) diff --git a/chapters/de/chapter4/4.mdx b/chapters/de/chapter4/4.mdx index 42c0488ff..48b41c566 100644 --- a/chapters/de/chapter4/4.mdx +++ b/chapters/de/chapter4/4.mdx @@ -18,7 +18,7 @@ Das Konzept von Modellkarte ("model card") stammt aus einer Forschungsrichtung b The model card usually starts with a very brief, high-level overview of what the model is for, followed by additional details in the following sections: Eine Modellkarte fängt mit einer kurzen, große Übersicht davon, was das Modell kann plus einige Details in den folgenden Abschnitte: -- Modell Beschreibung +- Modell-Beschreibung - Beabsichtigte Nutzung und Einschränkungen - Modell-Bedienung - Einschränkungen und Bias @@ -28,54 +28,56 @@ Eine Modellkarte fängt mit einer kurzen, große Übersicht davon, was das Model Lass uns anschauen, was genau in jedem Abschnitt stehen sollte. -#TODO -### Model description +# TODO +### Modell-Beschreibung -The model description provides basic details about the model. This includes the architecture, version, if it was introduced in a paper, if an original implementation is available, the author, and general information about the model. Any copyright should be attributed here. General information about training procedures, parameters, and important disclaimers can also be mentioned in this section. +Die Modellbeschreibung enthält grundlegende Details zum Modell. Dazu gehören die Architektur, die Version, ob es in einem Paper vorgestellt wurde, ob eine Originalimplementierung verfügbar ist, der Autor und allgemeine Informationen über das Modell. Eventuelle Urheberrechte sind hier anzugeben. In diesem Abschnitt können auch allgemeine Informationen zu Trainingsverfahren, Parametern und wichtigen Haftungsausschlüssen erwähnt werden. -### Intended uses & limitations +### Verwendungszweck und Einschränkungen -Here you describe the use cases the model is intended for, including the languages, fields, and domains where it can be applied. This section of the model card can also document areas that are known to be out of scope for the model, or where it is likely to perform suboptimally. +Hier beschreibst du die angedachten Anwendungsfälle fürs Modell, einschließlich der Sprachen, Felder und Domänen, in denen es angewendet werden kann. In diesem Abschnitt der Modellkarte können auch Bereiche dokumentiert werden, die bekanntermaßen außerhalb des Anwendungsbereichs des Modells liegen oder in denen die Leistung wahrscheinlich nicht optimal ist. -### How to use +### Modell-Bedienung -This section should include some examples of how to use the model. This can showcase usage of the `pipeline()` function, usage of the model and tokenizer classes, and any other code you think might be helpful. +Dieser Abschnitt sollte einige Beispiele für die Verwendung des Modells enthalten. Dies kann die Verwendung der Funktion `pipeline()`, die Verwendung der Modell- und Tokenizer-Klassen und jeden anderen Code zeigen, der deiner Meinung nach hilfreich sein könnte. -### Training data -This part should indicate which dataset(s) the model was trained on. A brief description of the dataset(s) is also welcome. +### Trainingsdaten -### Training procedure +In diesem Teil sollte angegeben werden, auf welchen Datensatz bzw. Datensätze das Modell trainiert wurde. Eine kurze Beschreibung des Datensatzes/der Datensätze ist ebenfalls willkommen. -In this section you should describe all the relevant aspects of training that are useful from a reproducibility perspective. This includes any preprocessing and postprocessing that were done on the data, as well as details such as the number of epochs the model was trained for, the batch size, the learning rate, and so on. +### Trainingsverfahren -### Variable and metrics +In diesem Abschnitt solltest du alle relevanten Aspekte des Modelltrainingsverfahren beschreiben, die für die Reproduzierbarkeit nützlich sind. Dazu gehören alle Vor- und Nachbearbeitungen, die an den Daten durchgeführt wurden, sowie Details wie die Anzahl der Trainingsepochene, Batch-Größe, die Lernrate usw. -Here you should describe the metrics you use for evaluation, and the different factors you are mesuring. Mentioning which metric(s) were used, on which dataset and which dataset split, makes it easy to compare you model's performance compared to that of other models. These should be informed by the previous sections, such as the intended users and use cases. +### Variablen und Metriken -### Evaluation results +Hier solltest du die Bewertungsmetriken beschreiben und die verschiedenen Faktoren, die du dabei mit berücksichtigst. Durch die Angabe, welche Metrik(en) verwendet wurden, für welchen Datensatz und welche Datensatzaufteilung, kannst du die Leistung deines Modells leicht mit der anderer Modelle vergleichen. Diese sollten durch die vorherigen Abschnitte informiert werden, wie z. B. die beabsichtigten Benutzer und Anwendungsfälle. -Finally, provide an indication of how well the model performs on the evaluation dataset. If the model uses a decision threshold, either provide the decision threshold used in the evaluation, or provide details on evaluation at different thresholds for the intended uses. +### Evaluierungsergebnisse -## Example +Abschließend gibst du an, wie gut das Modell mit dem Bewertungsdatensatz abschneidet. Wenn das Modell einen Entscheidungsschwellenwert verwendet, gib entweder den in der Bewertung verwendeten Entscheidungsschwellenwert an oder mach Angaben zur Bewertung bei verschiedenen Schwellenwerten für die beabsichtigten Verwendungszwecke. -Check out the following for a few examples of well-crafted model cards: +## Beispiel + +Im Folgenden findest du einige Beispiele von guten Modellkarten: - [`bert-base-cased`](https://huggingface.co/bert-base-cased) - [`gpt2`](https://huggingface.co/gpt2) - [`distilbert`](https://huggingface.co/distilbert-base-uncased) -More examples from different organizations and companies are available [here](https://github.com/huggingface/model_card/blob/master/examples.md). -## Note +Mehr Beispiele von verschiedene Organisationen/Firmen sind hier verfügbar [here](https://github.com/huggingface/model_card/blob/master/examples.md). + +## Hinweis -Model cards are not a requirement when publishing models, and you don't need to include all of the sections described above when you make one. However, explicit documentation of the model can only benefit future users, so we recommend that you fill in as many of the sections as possible to the best of your knowledge and ability. +Modellkarten sind bei der Veröffentlichung von Modellen nicht erforderlich und du musst bei der Erstellung nicht alle oben beschriebenen Abschnitte einbeziehen. Allerdings kann eine explizite Dokumentation des Modells künftigen Nutzern nur nützen, daher empfehlen wir dir, so viele Abschnitte wie möglich nach bestem Wissen und Gewissen auszufüllen. -## Model card metadata +## Modellkarte-Metadaten -If you have done a little exploring of the Hugging Face Hub, you should have seen that some models belong to certain categories: you can filter them by tasks, languages, libraries, and more. The categories a model belongs to are identified according to the metadata you add in the model card header. +Wenn du den Hugging Face Hub ein wenig erkundet hast, solltest du gesehen haben, dass einige Modelle zu bestimmten Kategorien gehören: Du kannst sie nach Aufgaben, Sprachen, Bibliotheken und mehr filtern. Die Kategorien, zu denen ein Modell gehört, werden anhand der Metadaten identifiziert, die du im Kopf der Modellkarte hinzufügst. -For example, if you take a look at the [`camembert-base` model card](https://huggingface.co/camembert-base/blob/main/README.md), you should see the following lines in the model card header: +Zum Beispiel sieh dir dieses an [`camembert-base` model card](https://huggingface.co/camembert-base/blob/main/README.md). Du solltest folgende Zeilen auf der Modellkarte sehen: ``` --- @@ -86,6 +88,6 @@ datasets: --- ``` -This metadata is parsed by the Hugging Face Hub, which then identifies this model as being a French model, with an MIT license, trained on the Oscar dataset. +Diese Metadaten werden vom Hugging Face Hub analysiert, der dieses Modell dann als französisches Modell mit einer MIT-Lizenz identifiziert, das auf dem Oscar-Datensatz trainiert wurde. -The [full model card specification](https://github.com/huggingface/hub-docs/blame/main/modelcard.md) allows specifying languages, licenses, tags, datasets, metrics, as well as the evaluation results the model obtained when training. +Die vollständige [Modellkarte](https://github.com/huggingface/hub-docs/blame/main/modelcard.md) ermöglicht die Angabe von Sprachen, Lizenzen, Tags, Datensätzen, Metriken sowie den Bewertungsergebnissen, die das Modell wann erhalten hat Ausbildung. diff --git a/chapters/de/chapter4/5.mdx b/chapters/de/chapter4/5.mdx index 341f9f348..65eac0fa9 100644 --- a/chapters/de/chapter4/5.mdx +++ b/chapters/de/chapter4/5.mdx @@ -1,12 +1,12 @@ -# Part 1 completed! +# Teil 1 abgeschlossen! -This is the end of the first part of the course! Part 2 will be released on November 15th with a big community event, see more information [here](https://huggingface.co/blog/course-launch-event). +Dies ist das Ende des ersten Teils des Kurses! Teil 2 wird am 15. November mit einem großen Community-Event veröffentlicht, weitere Informationen findest du [hier](https://huggingface.co/blog/course-launch-event). -You should now be able to fine-tune a pretrained model on a text classification problem (single or pairs of sentences) and upload the result to the Model Hub. To make sure you mastered this first section, you should do exactly that on a problem that interests you (and not necessarily in English if you speak another language)! You can find help in the [Hugging Face forums](https://discuss.huggingface.co/) and share your project in [this topic](https://discuss.huggingface.co/t/share-your-projects/6803) once you're finished. +Du solltest nun in der Lage sein, ein vorab trainiertes Modell für ein Textklassifizierungsproblem (einzelne Sätze oder Satzpaare) zu optimieren und das Ergebnis in den Model Hub hochzuladen. Um sicherzustellen, dass du diesen ersten Abschnitt beherrschst, solltest du genau das an einem Problem verwenden, das dich interessiert (und nicht unbedingt auf Englisch, wenn Sie eine andere Sprache sprechen)! Hilfe findest du in den [Hugging Face-Foren](https://discuss.huggingface.co/) und du kannst dein Projekt in [diesem Thema](https://discuss.huggingface.co/t/share-your-projects) teilen /6803), sobald du damit fertig bist. -We can't wait to see what you will build with this! +Wir freuen uns darauf, zu sehen, was du alles damit baust! diff --git a/chapters/de/chapter4/6.mdx b/chapters/de/chapter4/6.mdx index 4317fdb4f..90f8dfe79 100644 --- a/chapters/de/chapter4/6.mdx +++ b/chapters/de/chapter4/6.mdx @@ -9,126 +9,127 @@ classNames="absolute z-10 right-0 top-0" /> -Let's test what you learned in this chapter! +Lass uns testen, was du im vorheringen Kapitel gelernt hast! -### 1. What are models on the Hub limited to? +### 1. Auf welche Modelle sind die Hub-Modelle beschränkt? -### 2. How can you manage models on the Hub? +### 2. Wie kannst du die Modelle auf dem Hub verwalten? git-lfs for large files.", + text: "Durch git und git-lfs.", + explain: "Korrekt! Modelle auf dem Hub sind einfach Git-Repositories, die für große Dateien git-lfs benutzen.", correct: true } ]} /> -### 3. What can you do using the Hugging Face Hub web interface? +### 3. Was kannst du mit der Hugging Face Hub-Weboberfläche tun? -### 4. What is a model card? +### 4. Was ist eine Modellkarte? -### 5. Which of these objects of the 🤗 Transformers library can be directly shared on the Hub with `push_to_hub()`? +### 5. Welche dieser Objekte der 🤗 Transformers-Bibliothek können mit `push_to_hub()` direkt auf dem Hub geteilt werden? {#if fw === 'pt'} push_to_hub method, and using it will push all the tokenizer files (vocabulary, architecture of the tokenizer, etc.) to a given repo. That's not the only right answer, though!", + text: "Ein Tokenizer", + explain: "Richtig! Alle Tokenizer verfügen über die Methode push_to_hub, und wenn su sie verwendest, werden alle Tokenizer-Dateien (Vokabular, Architektur des Tokenizers usw.) in ein bestimmtes Repo verschoben. Aber das ist nicht die einzig richtige Antwort!", correct: true }, { - text: "A model configuration", - explain: "Right! All model configurations have the push_to_hub method, and using it will push them to a given repo. What else can you share?", + text: "Eine Modell-Konfiguration", + explain: "Richtig! Alle Modellkonfigurationen verfügen über die Methode push_to_hub, und wenn Sie sie verwenden, werden sie an ein bestimmtes Repo gepusht. Was kannst du sonst noch teilen?", correct: true }, { - text: "A model", - explain: "Correct! All models have the push_to_hub method, and using it will push them and their configuration files to a given repo. That's not all you can share, though.", + text: "Ein Model", + explain: "Richtig! Alle Modelle verfügen über die Methode push_to_hub, und wenn du sie verwendest, werden sie und ihre Konfigurationsdateien in ein bestimmtes Repo gepusht. Das ist jedoch nicht alles, was du teilen kannst.", correct: true }, { - text: "A Trainer", - explain: "That's right — the Trainer also implements the push_to_hub method, and using it will upload the model, its configuration, the tokenizer, and a model card draft to a given repo. Try another answer!", + text: "Ein Trainer", + explain: "Das ist richtig – der Trainer implementiert auch die Methode push_to_hub und lädt mit dieser Methode das Modell, seine Konfiguration, den Tokenizer und einen Modellkartenentwurf auf einen gegebenen Server hoch repo. Versuch es auch mit einer anderen Antwort!", correct: true } ]} @@ -137,92 +138,94 @@ Let's test what you learned in this chapter! push_to_hub method, and using it will push all the tokenizer files (vocabulary, architecture of the tokenizer, etc.) to a given repo. That's not the only right answer, though!", + explain: "Richtig! Alle Tokenizer verfügen über die Methode push_to_hub, und wenn du sie verwendest, werden alle Tokenizer-Dateien (Vokabular, Architektur des Tokenizers usw.) in ein bestimmtes Repo verschoben. Das ist aber nicht die einzige richtige Antwort!", correct: true }, { - text: "A model configuration", + text: "Eine Modell-Konfiguration", explain: "Right! All model configurations have the push_to_hub method, and using it will push them to a given repo. What else can you share?", + explain: "Richtig! Alle Modellkonfigurationen verfügen über die Methode push_to_hub, und wenn du sie verwendest, werden sie an ein bestimmtes Repo gepusht. Was kannst du sonst noch teilen?", correct: true }, { - text: "A model", - explain: "Correct! All models have the push_to_hub method, and using it will push them and their configuration files to a given repo. That's not all you can share, though.", + text: "Ein Modell", + explain: "Richtig! Alle Modelle verfügen über die Methode push_to_hub, und wenn du sie verwendest, werden sie und ihre Konfigurationsdateien in ein bestimmtes Repo gepusht. Das ist jedoch nicht alles, was du teilen kannst.", correct: true }, { - text: "All of the above with a dedicated callback", - explain: "That's right — the PushToHubCallback will regularly send all of those objects to a repo during training.", + text: "Alles oben mit einem speziellen `Callback`", + explain: "Das ist richtig – der PushToHubCallback sendet während des Trainings regelmäßig alle diese Objekte an ein Repo.", correct: true } ]} /> {/if} -### 6. What is the first step when using the `push_to_hub()` method or the CLI tools? +### 6. Was ist der erste Schritt bei Verwendung der Methode `push_to_hub()` oder der CLI-Tools? -### 7. You're using a model and a tokenizer — how can you upload them to the Hub? +### 7. Du verwendest ein Modell und einen Tokenizer – wie kannst du diese auf den Hub hochladen? huggingface_hub utility.", - explain: "Models and tokenizers already benefit from huggingface_hub utilities: no need for additional wrapping!" + text: "Innerhalb der Python-Runtime, indem man sie in ein huggingface_hub-Dienstprogramm einschließt.", + explain: "Modelle und Tokenizer profitieren bereits von den Dienstprogrammen huggingface_hub: kein zusätzlicher Wrapping erforderlich!" }, { - text: "By saving them to disk and calling transformers-cli upload-model", - explain: "The command upload-model does not exist." + text: "Indem du sie auf der Festplatte speicherst und transformers-cli upload-model aufrufst", + explain: "Der Befehl upload-model existiert nicht." } ]} /> -### 8. Which git operations can you do with the `Repository` class? +### 8. Welche Git-Operationen kann man mit der Klasse „Repository“ ausführen? git_commit() method is there for that.", + text: "Ein Commit.", + explain: "Richtig, dafür ist die git_commit() Methode da.", correct: true }, { - text: "A pull", - explain: "That is the purpose of the git_pull() method.", + text: "Ein Pull", + explain: "Das ist der Zweck der git_pull() Methode.", correct: true }, { - text: "A push", - explain: "The method git_push() does this.", + text: "Ein Push", + explain: "Die Methode git_push() macht das.", correct: true }, { - text: "A merge", - explain: "No, that operation will never be possible with this API." + text: "Ein Merge", + explain: "Nein, die Operation wird mit dieser API nie möglich sein." } ]} />