#RageAgainstTheMachineTranslation
Es tut mir leid, dass dieser Text maschinell übersetzt wird. Aber bei diesem ganzen Projekt geht es darum, mit Sprachen, die ich selbst nicht kenne, um Hilfe zu bitten,
also schien es die einfache Lösung zu sein. Wenn eine Übersetzung so schlecht ist, dass sie Sie stört, können Sie mir gerne eine bessere Übersetzung per E-Mail an
pellen@gmail.com senden. Aber ehrlich gesagt wäre mir mehr geholfen, wenn Sie sich die Mühe machen würden, stattdessen ein paar
mehr Stapel deutscher Wörter zu sortieren. Nochmals Entschuldigung!
Warte was? Warum sollte ich das tun?
Weil diese Informationen mir und möglicherweise anderen Herstellern von Wortspielen helfen werden, zu wissen, welche Wörter in verschiedenen Sprachen gebräuchlich oder weniger gebräuchlich sind. Dies kann uns helfen, unsere Spiele besser zu machen.
Jeder Satz von zehn Wörtern, die Sie danach sortieren, wie häufig sie Ihrer Meinung nach sind, ergibt 45 Vergleiche zwischen Paaren von zwei Wörtern, sobald sie eingereicht wurden. Nun, vorausgesetzt, Sie blockieren Google Analytics nicht.
Deaktivieren Sie daher für diese Domain alle Werbeblocker- oder Anti-Tracker-Plug-ins, die Sie ausführen. Es gibt hier sowieso keine Werbung zu blockieren, und wenn Sie Google Analytics blockieren, werden Ihre Sortierdaten nicht aufgezeichnet.
Was hat Google Analytics damit zu tun?
Ich bin kein Datenbankprogrammierer, also habe ich die von Ihnen bereitgestellten Sortierdaten auf etwas hackige Weise gespeichert. Meine Lösung, um den Aufbau einer eigenen Datenbank zu vermeiden, ist zu haben
Jeder Stapel sortierter Wörter erzeugt ein "Ereignis" in Google Analytics. Auf diese Weise kann ich mich für diese Seite bei Google Analytics anmelden und die Informationen von dort zur weiteren Verarbeitung abrufen.
Bedeutet dies, dass diese Website Cookies von Drittanbietern verwendet?
Ja, Google Analytics verwendet Cookies. Ich setze auch ein Erstanbieter-Cookie für jede Sprache, für die Sie Wörter sortieren, um sich daran zu erinnern, welche Wörter Sie bereits sortiert haben.
Wie kann ich Ihnen oder anderen Spieledesignern helfen, ein paar Wörter zu sortieren?
Wenn Sie diese Seite gefunden haben, liegt das wahrscheinlich daran, dass Sie mein Spiel Squardle gespielt haben . Squardle, Wordle und die meisten anderen Wordle-ähnlichen Spiele verwenden zwei verschiedene Wortlisten: Eine für
Wörter, die als Antwort auftauchen können, und eine andere mit anderen Wörtern, die nicht die Antwort sein können, die aber (zusätzlich zur ersten Liste) als Vermutungen erlaubt sind. Dies liegt daran, wenn die Antworten
des Puzzles ist ein Wort, von dem der typische Spieler noch nie gehört hat, das Puzzle fühlt sich unfair an und macht nicht so viel Spaß. Aber auf der anderen Seite, wenn Sie einen großen Wortschatz haben, sollten Sie immer noch dazu in der Lage sein
Erraten Sie diese weniger bekannten Wörter oder die Wortliste des Spiels fühlt sich unvollständig an. Das Generieren einer Rangfolge aller Wörter basierend auf mehreren Benutzern wird hoffentlich dazu führen, dass die Wörter als mögliche Antworten ausgewählt werden
dem typischen Spieler besser bekannt.
Keine Respektlosigkeit gegenüber Joshs Freundin, Wordles Wortliste ist nicht schlecht. Aber es enthält ein paar Wörter, von denen ich denke, dass der durchschnittliche Spieler nachschlagen müsste, wie "OVATE" und "SPODE".
Andere Wortspiele als Wordle können auch eine längere Liste gebräuchlicher Wörter benötigen. Wenn diese Seite genug Sortierungen von Wörtern bekommt, könnte das ganze Wörterbuch beliebig lang und immer noch abgeschnitten werden
Holen Sie sich die bekanntesten Wörter bis zu diesem Punkt.
Durch Crowdsourcing der Informationen kann ich diese Daten auch für andere Sprachen als Englisch erhalten, solange ich eine Startwortliste finden kann, die Open Source und vollständig ist
genug für diese Sprache.
Wenn ich genug Sortierungen bekomme, damit diese Daten mir hilfreich sind, werde ich auch Links zu den von mir erstellten sortierten Wörterbüchern veröffentlichen und möglicherweise auch zu den Daten, die ich aus Google Analytics exportiert habe
falls das jemand auch will. Diese Links werden dann zu dieser FAQ hinzugefügt.
Warum verwenden Sie nicht stattdessen einfach ein "Korpus"? Das heißt, nehmen Sie eine große Menge an gesammeltem Text und verwenden Sie die Worthäufigkeiten daraus?
Ich habe das getan, um zu entscheiden, welche Wörter als Antworten in Swedish Squardle zugelassen werden sollen, basierend auf ihrer Verwendung in der schwedischen Wikipedia. Das hat gut funktioniert, aber es war viel Formatierungsarbeit,
und ich habe keinen Zugriff auf diese Daten für andere Sprachen, insbesondere nicht auf die gleiche Weise formatiert. Aber selbst wenn ich es tat, musste ich einen Teil meines eigenen Urteilsvermögens einsetzen, um einige zu korrigieren
Kuriositäten und Datenfehler im Korpus, und das könnte ich nicht für Sprachen tun, die ich selbst nicht kenne. Auch alle Wörter der schwedischen Wikipedia nur einmal zusammen
mit ihren Metadaten reicht aus, um zu groß zu sein, um sie sogar in einem normalen Texteditor zu bearbeiten. Also musste ich die Daten für die Fünf-Buchstaben-Wörter in kleineren Stapeln exportieren, damit meine Programme nicht auf mir einfrieren.
Also ist diese Seite kein ein Spiel?
Nicht jetzt. In Zukunft könnte ich die Sortierung gamifizieren, um Ihnen eine Punktzahl zu geben, die darauf basiert, wie genau Ihre Art jeder Wortgruppe mit den Daten früherer Benutzer übereinstimmt. Aber zusätzlich zu diesem Wesen
etwas, das ich noch nicht codiert habe, ich würde auch zuerst einige Daten für jede Sprache benötigen, damit diese Bewertung nicht völlig zufällig ist.
Könnte nicht ein einziger Troll dieses ganze Projekt zerstören, indem er einfach ein paar zufällig sortierte Wörter oder Wörter eingibt, die in der umgekehrten Reihenfolge wie gewünscht sortiert sind?
Hoffentlich macht es nicht Spaß, dieses Projekt zu trollen. Aber ich werde Daten über den Sortierer jedes Stapels speichern, sodass ich bei Bedarf wahrscheinlich die Benutzer ausschließen kann, die (im Durchschnitt) nicht genug dem Konsens entsprechen
davon, wie häufig die Wörter sind. Allerdings gilt auch hier das Gesetz von Wil Wheaton: „Don’t be a dick.“
Wie soll ich zwei sehr gebräuchliche Wörter sortieren? Und wie kann ich möglicherweise zwei Wörter sortieren, die ich nicht kenne?
Denken Sie nicht zu viel darüber nach, stellen Sie sie nebeneinander und sie werden von Ihnen fast die gleiche Rangfolge erhalten, da sie nur in ihrem Vergleich miteinander häufiger als der andere angesehen wird.
Wenn genügend Benutzer Wörter sortieren, wird sich alles ausgleichen. Für Wörter, die Sie unterhalb des roten Balkens platzieren, habe ich auch die Möglichkeit, den Rangunterschied zwischen diesen Wörtern zu berücksichtigen
weniger, wenn ich die Daten verarbeite. Ob ich mich dafür entscheide, mich darum zu kümmern, hängt davon ab, ob ich denke, dass es wichtig ist und das Ergebnis besser macht.
O que devo fazer aqui?
Arraste e solte as palavras para classificá-las com as palavras mais comuns na parte superior e as palavras menos comuns (ou palavras que você não conhece) na parte inferior. Em seguida, separe sua classificação arrastando e soltando
a barra vermelha para estar acima de qualquer palavra que você não sabia que era uma palavra. A ordem individual das palavras importa, não apenas onde você coloca a barra vermelha.
OK, leve-me para a classificação!
Esperar o quê? Por que devo fazer isso?
Porque esta informação vai me ajudar e possivelmente outros criadores de jogos de palavras a saber quais palavras em diferentes idiomas são comuns ou menos comuns. Isso pode nos ajudar a melhorar nossos jogos.
Cada lote de dez palavras que você classificar por quão comuns você acha que elas são, dará 45 comparações entre pares de duas palavras assim que forem enviadas. Bem, supondo que você não esteja bloqueando o Google Analytics.
Portanto, para este domínio, desative qualquer bloqueador de anúncios ou plug-ins antirastreadores que você esteja executando. Não há anúncios aqui para bloquear de qualquer maneira, e se você estiver bloqueando o Google Analytics, seus dados de classificação não serão registrados.
O que o Google Analytics tem a ver com isso?
Eu não sou um programador de banco de dados, então eu guardei os dados de classificação que você está fornecendo de uma maneira um pouco hacky. Minha solução para evitar ter que configurar um banco de dados próprio é ter
cada lote de palavras classificadas cria um "evento" no Google Analytics. Dessa forma, posso fazer login no Google Analytics para esta página e obter as informações de lá para processamento adicional.
Isso significa que este site usa cookies de terceiros?
Sim, o Google Analytics usa cookies. Também estou configurando um cookie primário para cada idioma para o qual você está classificando as palavras para lembrar quais palavras você já classificou até agora.
Como estou classificando um monte de palavras ajudando você ou qualquer outro designer de jogos?
Se você encontrou este site, é provável porque você jogou meu jogo Squardle . Squardle, Wordle e a maioria dos outros jogos do tipo Wordle usam duas listas diferentes de palavras: uma para
palavras que podem aparecer como resposta, e outra com outras palavras que não podem ser a resposta mas que (além da primeira lista) são permitidas como palpites. Isso porque se as respostas
do quebra-cabeça é uma palavra que o jogador típico nunca ouviu falar, o quebra-cabeça parece injusto e não tão divertido. Mas, por outro lado, se você tiver um vocabulário grande, ainda poderá
adivinhe essas palavras menos conhecidas ou a lista de palavras do jogo parece incompleta. A geração de uma classificação de todas as palavras com base em vários usuários fará com que as palavras selecionadas como possíveis respostas sejam
mais bem conhecido para o jogador típico.
Se eu obtiver classificações suficientes para que esses dados sejam úteis para me, também publicarei links para os dicionários classificados que crio e, possivelmente, também para os dados que exportei do Google Analytics
se alguém quiser isso também. Esses links serão adicionados a este FAQ.
Então esta página não é um jogo?
Agora não. No futuro, posso gamificar a classificação para fornecer uma pontuação com base em quão próximo seu tipo de cada lote de palavras corresponde aos dados de usuários anteriores. Mas além disso ser
algo que ainda não codifiquei, também precisaria de alguns dados para cada idioma primeiro para que essa pontuação não seja completamente aleatória.
Um único troll não poderia destruir todo este projeto apenas digitando um monte de palavras classificadas aleatoriamente ou palavras classificadas na ordem inversa do que você deseja?
Espero que trollar esse projeto não seja divertido o suficiente. Mas estarei armazenando dados sobre o classificador de cada lote, portanto, se necessário, provavelmente posso excluir os usuários que (em média) não estão em conformidade o suficiente com o consenso
de quão comuns são as palavras. Dito isso, a lei de Wil Wheaton ainda se aplica aqui: "Não seja um idiota".
Como devo classificar duas palavras muito comuns? E como posso classificar duas palavras que não conheço?
Não pense demais, coloque-os um ao lado do outro e eles receberão quase a mesma classificação de você, pois é apenas na comparação entre eles que é considerado mais comum que o outro.
Com um número suficiente de usuários classificando as palavras, tudo ficará equilibrado. Para palavras que você colocar abaixo da barra vermelha eu também terei a opção de fazer a diferença de classificação entre essas palavras importar
menos quando estou processando os dados. Se eu decidir me importar com isso, depende se eu acho que isso importará e tornará o resultado melhor.
Isso parece o meu tipo de projeto! Existe alguma outra maneira de ajudar além de classificar palavras?
Divulgue o link para esta página para que mais pessoas possam classificar as palavras!
¿Qué debo hacer aquí?
Arrastra y suelta las palabras para ordenarlas con las palabras más comunes en la parte superior y las palabras menos comunes (o palabras que no conoces) en la parte inferior. Luego separe su clasificación arrastrando y soltando
la barra roja para estar encima de cualquier palabra que no sabías que era una palabra. El orden individual de las palabras sí importa, no solo dónde colocas la barra roja.
OK, ¡llévame a la clasificación!
Espera, ¿qué? ¿Por qué debo hacer esto?
Porque esta información me ayudará a mí y posiblemente a otros creadores de juegos de palabras a saber qué palabras en diferentes idiomas son comunes o menos comunes. Esto puede ayudarnos a mejorar nuestros juegos.
Cada lote de diez palabras que clasifiques por lo comunes que crees que son, dará 45 comparaciones entre pares de dos palabras una vez que se envíen. Bueno, asumiendo que no estás bloqueando Google Analytics.
Entonces, para este dominio, desactive cualquier bloqueador de anuncios o complementos anti-rastreador que esté ejecutando. No hay anuncios aquí para bloquear de todos modos, y si está bloqueando Google Analytics, sus datos de clasificación no se registrarán.
¿Qué tiene que ver Google Analytics con esto?
No soy un programador de bases de datos, por lo que me dediqué a almacenar los datos de clasificación que proporciona de una manera un poco pirateada. Mi solución para evitar tener que configurar una base de datos propia es tener
cada lote de palabras ordenadas crea un "evento" en Google Analytics. De esta manera, puedo iniciar sesión en Google Analytics para esta página y obtener la información de allí para su posterior procesamiento.
¿Significa esto que este sitio utiliza cookies de terceros?
Sí, Google Analytics utiliza cookies. También estoy configurando una cookie de origen para cada idioma en el que está ordenando palabras para recordar qué palabras ya ha ordenado hasta ahora.
¿Cómo puedo clasificar un montón de palabras ayudándote a ti o a cualquier otro diseñador de juegos?
Si has encontrado este sitio, es probable porque has jugado mi juego Squardle . Squardle, Wordle y la mayoría de los demás juegos similares a Wordle usan dos listas de palabras diferentes: una para
palabras que pueden aparecer como respuesta, y otra con otras palabras que no pueden ser la respuesta pero que (además de la primera lista) se permiten como conjeturas. Esto se debe a que si las respuestas
del rompecabezas es una palabra que el jugador típico nunca ha escuchado, el rompecabezas se siente injusto y no tan divertido. Pero, por otro lado, si tienes un gran vocabulario, aún deberías poder
adivina esas palabras menos conocidas o la lista de palabras del juego se siente incompleta. Es de esperar que generar una clasificación de todas las palabras en función de varios usuarios haga que las palabras seleccionadas como posibles respuestas sean
más bien conoce al jugador típico.
Si obtengo suficientes clasificaciones para que estos datos sean útiles para mí, también publicaré enlaces a los diccionarios ordenados que hago, y posiblemente también enlace a los datos que he exportado de Google Analytics.
si alguien quiere eso también. Esos enlaces se agregarán a estas preguntas frecuentes.
¿Entonces esta página no es un juego?
Ahora mismo no. En el futuro, podría gamificar la clasificación para darle una puntuación basada en qué tan cerca su clasificación de cada lote de palabras coincide con los datos de usuarios anteriores. Pero además de este ser
algo que aún no he codificado, también necesitaría algunos datos para cada idioma primero para que esa puntuación no sea completamente aleatoria.
¿No podría un solo troll destruir todo este proyecto simplemente ingresando un montón de palabras ordenadas al azar, o palabras ordenadas en el orden inverso al que deseas?
Esperemos que trolear este proyecto no sea lo suficientemente divertido. Pero almacenaré datos sobre el clasificador de cada lote, por lo que, si es necesario, probablemente pueda excluir a los usuarios que (en promedio) no se ajustan lo suficiente al consenso.
de lo comunes que son las palabras. Dicho esto, la ley de Wil Wheaton todavía se aplica aquí: "No seas un imbécil".
¿Cómo debo ordenar dos palabras muy comunes? ¿Y cómo puedo clasificar dos palabras que no conozco?
No lo piense demasiado, colóquelos uno al lado del otro y recibirán casi la misma clasificación de usted, ya que solo en su comparación entre sí se considera más común que el otro.
Con suficientes usuarios clasificando palabras, todo se equilibrará. Para las palabras que coloque debajo de la barra roja, también tendré la opción de hacer que la diferencia de clasificación entre esas palabras sea importante.
menos cuando estoy procesando los datos. Si decido preocuparme por esto depende de si creo que importará y mejorará el resultado.
¡Esto suena como mi tipo de proyecto! ¿Hay alguna otra forma en la que pueda ayudar además de clasificar las palabras?
¡Difunde el enlace a esta página para que más personas puedan ordenar palabras!
What should I do here?
Drag and drop the words to sort them with the most common words at the top, and the least common words (or words you don't know of) to the bottom. Then seperate your ranking by dragging and dropping
the red bar to be above any word you didn't know was a word. The individual order of the words does matter, not only where you place the red bar.
OK, take me to the sorting!
Wait what? Why should I do this?
Because this information will help me and possibly other makers of word games know what words in different languages are common or less common. This can help us to make our games better.
Every batch of ten words you sort by how common you think they are will give up to 45 comparisons between pairs of two words once they are submitted. Well, assuming you aren't blocking Google Analytics.
So for this domain, turn off any ad blocker or anti-tracker plugins you're running. There are no ads here to block anyways, and if you're blocking Google Analytics your sorting data won't be recorded.
What does Google Analytics have to do with this?
I'm not a database programmer, so I've gone about storing the sorting data you're providing in a slightly hacky way. My solution to avoid having to set up a database of my own is to have
each batch of sorted words create an "event" in Google Analytics. This way I can log into Google Analytics for this page and grab the information from there for further processing.
Does this mean this site uses third party cookies?
Yes, Google Analytics use cookies. I'm also setting a first party cookie for each language you're sorting words for to remember which words you've already sorted.
How is me sorting a bunch words helping you or any other game designer?
If you've found this site it's likely because you've played my game Squardle . Squardle, Wordle and most other Wordle-like games use two different lists of words per language: One for
words that can show up as an answer, and another one with other words that can't be the answer but that (in addition to the first list) are allowed as guesses. This is because if the answers
of the puzzle is a word that the typical player has never heard of, the puzzle feels unfair and not as fun. But on the other hand if you do have a large vocabulary you should still be able to
guess those lesser known words; otherwise the game's word list would feel incomplete. Generating a ranking of all words based on multiple users will hopefully make the words selected as possible
answers be more well know to the typical player.
The New York Times has purchased Wordle from its designer Josh Wardle, and while they've so far haven't tried to stop anyone from using the same word list as Wordle, they have
sent out cease and desist letters to some sites that for example let you play previous days' Wordle later on. It's likely that they can't really argue that copyright for the word list of all
English five letter words is theirs, since I doubt that Joss Wardle made it himself. But the curation of what words that are possible answers was reportedly done by Josh's
fiancée. So there's some possibility that a lawyer working for the New York Times could try to come to the conclution that the answers list now copyrighted by them. It would be an odd idea, but
anyone getting a C&D letter knows that it's always easier to, well, cease and desist than it is to try to argue your case in court. So I'd rather be prepared in advance should they try to do this.
No disrespect to Josh's fiancée, as Wordle's list of words isn't bad! But if does include a few words that I think the average player would have to look up, such as "OVATE" and "SPODE".
Other word games, such as Weekly Squardle, can also have a need for a longer list of common words to function. If this page gets enough sortings of words the whole dictionary could be cut off
at any length and still get the most well known words up to that point.
Crowdsourcing the information also lets me get this data for languages other than English, as long as I can find a starting word list that is open source and complete
enough for that language.
EDIT: I've at time of writing this gotten 49951 batches of 10 words each sorted for the five-letter English words. I've used this data to generate the expanded word list for
Weekly Squardle and to make an even more expanded word list for the bonus weekly boards for my Patreon supporters. As promised, here is
the .xlsx file with the sorted words and the sorting data for anyone else who might have use for it. If you have need for the sorting data for other languages
e-mail me and I'll share that as well, I just haven't compiled it more than to do what I currently had use for myself.
Why don't you just use a "corpus" instead? That is, take a large body of gathered text such as all of Wikipedia, and use the word frequencies of it?
I did that at first to decide what words to allow as answers in Swedish Squardle, based on their use on Swedish Wikipedia. This sort of worked, but it was a lot of formatting work,
and I don't have access to that data for other languages, especially not formatted the same way. But even if I did, I had to use some of my own judgement to correct for some
oddeties and data errors in the corpus, and I couldn't do that for languages that I don't know myself. Also, all the words of Swedish Wikipedia only just once together
with their meta-data is enough to be too big to even edit in a normal text editor. In the end this method had too many oddeties to be great as it also included some typos and didn't consistantly
give all forms of all words. So if some form of a word wasn't used on Wikipedia, that then wasn't a legal guess. So in the end I changed to using a free dictionary plus this word-sorter for Swedish
Squardle, and it made the game much better for it.
So this page isn't a game?
Right now, no. In the future I might gamify the sorting to give you a score based on how closely your sort of each batch of words match the data from previous users. But in addition to this being
something I've not coded yet, I would also need some data for every language first for that scoring to not be completely random.
Couldn't a single troll destroy this whole project by just entering a bunch of randomly sorted words, or words sorted in the reverse order from what you want?
Hopefully trolling this project isn't fun enough. But I will be storing data about each batch's sorter, so if needed I can exclude the users who (on average) aren't conforming enough
to the consensus of how common the words are. That said, Wil Wheaton's law still applies here: "Don't be a dick."
How should I sort two very common words? And how can I possibly sort two words I don't even know?
Don't overthink it, put them next to each other and they will recieve close to the same ranking from you, as it's only in their comparison with each other is considered more common than the other.
With enough users sorting words it will all even out. For words you place below the red bar I will also have the option to make the ranking difference between those words matter
less or not at all when I'm processing the data. EDIT: Not caring about the order of words below the bar indeed turned out to be what worked best.
This sounds like my sort of project! Are there any other way I can help out than just sorting words?
Spread the link to this page so that more people can sort words! If you want to help out financially, check out my Patreon page.
Also, report any bugs you may find to pellen@gmail.com!