CSV-Einstellungen

Aufbau der CSV

Bevor Sie eine SimpleSearch anlegen können, benötigen Sie eine CSV-Datei, die die Daten für die SimpleSearch enthält. CSV steht für “Comma Separated Values”, also von Kommata getrennten Werten. Beim Aufbau der CSV sollten Sie die folgenden Punkte beachten.

Die Spaltenüberschriften in der CSV sollten nur aus Kleinbuchstaben, Zahlen und Minuszeichen bestehen. Umlaute, Leerzeichen, Großbuchstaben und Sonderzeichen können zu Problemen beim Einlesen der Daten in die Datenbank führen.

Jeder Spaltenname muss eindeutig sein. Sollten Sie einen Spaltennamen doppelt vergeben, so wird nur eine Spalte benutzt werden.

Um eine CSV-Datei zu erstellen, können Sie Microsoft Excel verwenden. Nutzen Sie am besten Excel-Dateien ohne weitere Formatierung, da beim Umwandeln in CSV-Dateien jede Formatierung (ausgenommen Zeilenumbrüche) verloren geht.

In Excel gehen Sie zum Speichern einer CSV-Datei wie folgt vor: Wählen Sie “Datei” > “Speichern unter…” und dann als Dateityp entweder “CSV UTF-8 (durch Trennzeichen getrennt)” (empfohlen) oder “CSV (Trennzeichen-getrennt)”. Ihr aktuelles Dokument wird mit der Dateiendung “.csv” gespeichert. Die genauen Bezeichnungen können in unterschiedlichen Excel-Versionen etwas abweichen.

Falls Sie Ihre CSV-Datei mit einer anderen Software erstellen, beachten Sie bitte die folgenden Hinweise für die Erstellung der CSV für die SimpleSearch.

Redaktioneller Hinweis

Bitte achten Sie darauf, keine Inhalte in CSV-Spalten nach der letzten Spalte mit einer Überschrift zu schreiben. Es ist nicht möglich, Kommentare oder Hinweise für die Bearbeitung der Daten in der CSV für die SimpleSearch zu speichern. Diese Inhalte werden von der SimpleSearch ebenfalls erkannt und führen dazu, dass die CSV nicht eingelesen werden kann.

Weitere Hinweise dazu finden Sie weiter unten im Abschnitt E-Mail bei Problemen.

Technische Spezifikationen

Als Zeichensatz sollten Sie am besten UTF-8 verwenden. Damit sind neben den deutschen Umlauten auch Zeichen aus anderen Sprachen und alle Sonderzeichen enthalten. Westeuropäisch (ISO) funktioniert für deutsche Datensätze ohne spezielle Sonderzeichen ebenfalls, aber UTF-8 ist die Empfehlung.

Als Trennzeichen zwischen den Zeilen verwenden Sie bitte “CRLF” (steht für “Carriage Return/Line Feed” und entsteht normalerweise mit der Enter-Taste), wie bei Windows üblich. Wenn Sie die CSV mit einem Texteditor bearbeiten, können Sie den Zeilenumbruch mit dem spiegelverkehrten P-Symbol einblenden und kontrollieren.

Als Trennzeichen zwischen den Zellen verwenden Sie bitte das Semikolon “;”. Die Trennung mit Komma “,” kann zu Problemen mit dem Einlesen der Daten führen.

Als Einfassung für den Zelleninhalt verwenden Sie bitte ein doppeltes Anführungszeichen (“), also z.B. “test”. Sie müssen diesen Container für Inhalte verwenden, in denen Semikolon, doppelte Anführungszeichen oder Zeilenumbrüche vorkommen. Excel erzeugt diese normalerweise automatisch, wenn sie benötigt werden. Wenn Sie ein doppeltes Anführungszeichen innerhalb des Containers benutzen, so verdoppeln Sie dieses, also z.B. “Ich sage ““Test”“.”

Reiter "CSV-Einstellungen"

Im Reiter “CSV-Einstellungen” wird die CSV mit den Inhalten für die SimpleSearch hinterlegt. Dazu gibt es zwei Möglichkeiten.

Reiter "CSV-Einstellungen" in der SimpleSearch mit den im Text beschriebenen Feldern.

Reiter "CSV-Einstellungen"

Linke Seite - einmaliges Einlesen einer CSV

Auf der linken Seite können Sie eine, in Imperia hochgeladene, CSV einbinden. Die Datei wird einmalig beim Veröffentlichen der SimpleSearch eingelesen. Das ist für kleinere CSV-Dateien mit bis zu 200 Zeilen (Datensätzen) nutzbar.

Mit dem Linktool können Sie eine CSV-Datei aus dem MAM auswählen. Dabei werden der CSV-Datei Titel, die CSV-Datei URL und das CSV-Datei Copyright ausgefüllt. Optional können Sie einen CSV-Datei Stand hinterlegen, um diesen intern zu dokumentieren. Die restlichen Angaben (“Copyright anzeigen?”, “CSV-Datei Copyright präzisieren” und “CSV-Datei Dateityp”) können Sie so belassen.

Alle Angaben zur CSV werden nicht im Frontend angezeigt.

Sobald die SimpleSearch veröffentlicht wird, werden die Daten der CSV in eine Datenbank einmalig eingelesen und sind für die Suche und Anzeige verfügbar. Jede Änderung an der CSV muss über eine Veröffentlichung der SimpleSearch erneut eingelesen werden.

Rechte Seite - automatischer Import einer CSV

Auf der rechten Seite unter “Automatischer Import von CSV-Dateien ohne Imperia” können Sie eine URL für Automatikimport von CSV hinterlegen, die jede Stunde auf Änderungen geprüft und bei einer Änderung neu eingelesen wird. Mit dieser Variante können auch größere CSV-Dateien mit mehr als 200 Zeilen eingelesen werden.

Neben der URL zu der CSV-Datei wird hier auch die Angabe einer E-Mail-Adresse für Fehlermeldungen des Automatikimports benötigt. Diese wird angeschrieben, wenn es Probleme beim Importieren der CSV-Datei gab.

Die CSV-Datei kann bei dieser Variante sowohl in Imperia hochgeladen als auch auf einem externen Webspeicher abgelegt werden. Bei einem externen Webspeicher ist wichtig, dass dieser eine, im Browser aufrufbare, URL bereitstellt und stets gut erreichbar ist. Mit dieser Variante ist es bspw. möglich, die Eingaben aus einem Formular mit Datenbank oder die Ausgaben einer Fachanwendung für die Nutzer*innen anzubieten.

E-Mail bei Problemen mit dem Einlesen der Daten wegen fehlerhafter Spaltenbezeichnungen. Die E-Mail enthält die URL der betroffenen SimpleSearch, einige technische Angaben zur besseren Einordnung durch die Entwicklung (falls nötig) und die Informationen zu den fehlerhaften Spalten.

E-Mail bei Problemen mit Spaltenbezeichnungen

E-Mail bei Problemen

Wenn die CSV nicht eingelesen werden kann, wird an die hinterlegte E-Mail-Adresse eine Mail geschickt. Diese E-Mail wird bereits in der Vorschau der SimpleSearch ausgelöst. Es gibt verschiedene Varianten dieser E-Mail.

Die E-Mail wird verschickt, wenn der Server, wo die CSV hochgeladen wurde, nicht erreichbar ist. Das kann bspw. passieren, wenn ein Problem mit den Berlin.de-Live-Seiten besteht. Hier können Sie normalerweise nichts redaktionell unternehmen.

Die wichtigere Variante ist die E-Mail bei fehlerhaften Spaltenbezeichnungen (siehe Screenshot). Hier enthält die E-Mail wichtige Informationen, was redaktionell angepasst werden muss. In der E-Mail finden Sie neben der URL der betroffenen SimpleSearch auch die fehlerhaften Spalten. Im Screenshot sehen Sie die folgenden Informationen zu den Spalten:

  • Erlaubte Felder: trauungsorte, lat, lng.
  • Gefundene Felder: trauungsort, lat, lng.
  • Überflüssige Felder: trauungsort.

Die “erlaubten Felder” zeigen die hinterlegten Bezeichnungen in den SimpleSearch-Tabellenspalten-Modulen.
Die “gefundenen Felder” entsprechen den Überschriften der Spalten in der CSV.
Bei “überflüssige Felder” wird angezeigt, welche Felder fehlerhaft sind.
Der Vergleich geht immer von der SimpleSearch aus und schaut mit diesen Informationen in die CSV. Daher wird im Beispiel die Spalte “trauungsort” aus der CSV als fehlerhaft gekennzeichnet.

Mit dieser Information können Sie die SimpleSearch oder die CSV anpassen. Es ist meistens einfacher, die SimpleSearch anzupassen und dort die Bezeichnung der Tabellenspalte zu korrigieren. Also in diesem Beispiel in der SimpleSearch “trauungsort” in der entsprechenden Tabellenspalte einzutragen.

Es gibt allerdings Beispiele, wo die CSV angepasst werden muss. Wenn Sie bei den gefundenen Feldern bzw. bei den überflüssigen Feldern Bezeichnungen wie “LeereSpalte4” (Zahlen variieren) sehen, dann muss die CSV bearbeitet werden. So eine “LeereSpalte” bedeutet, dass Imperia in der CSV Inhalte in einer hinteren Spalte ohne eine Überschrift gefunden hat. Leider zeigt die Zahl nicht an, welche Spalte betroffen ist. Hier ist die Empfehlung, nach der letzten Spalte mit Inhalten, die nächsten 5-10 Spalten zu markieren (in Excel oben den Spalten-Buchstaben anklicken) und zu löschen. Falls Sie den fehlerhaften Eintrag sehen, können Sie diesen natürlich auch so korrigieren.

Wenn Sie die E-Mail mit einer Fehlermeldung beim Einlesen der CSV einmalig erhalten, müssen Sie sich normalerweise keine Sorgen machen. Einmalige Aussetzer, besonders in der Nacht, können passieren.

Wenn Sie jede Stunde, also bei jedem Einleseversuch, eine E-Mail erhalten, dann stimmt etwas mit der CSV oder der SimpleSearch nicht. Schauen Sie in der E-Mail nach, was das Problem ist.

Redaktioneller Hinweis

Wenn eine CSV-Datei hochgeladen wird, wird die komplette Datenbank geleert und mit dem neuen Inhalt der CSV befüllt. Das bedeutet, dass nur vollständige CSV-Dateien in die SimpleSearch geladen werden sollten. Es findet kein Hinzufügen der Daten aus einer CSV zu bereits bestehenden Daten statt.

Weitere Informationen und Hilfe

Support-Kontakt: Probleme im Edit

Sie benötigen weitere Hilfe durch den Support? Stellen Sie gerne eine Anfrage mit dem verlinkten Formular. Weitere Informationen