Du bist hier: Tips » Scripte » PHP
PHP
Referenzliste

htmlspecialchars

String-Funktionen

    Befehl:
string htmlspecialchars ( string $string [, int $flags = ENT_COMPAT | ENT_HTML401 [, string $encoding = 'UTF-8' [, bool $double_encode = true ]]] )


    Parameter-Liste:
NameBeschreibung
stringsDie zu konvertierende Zeichenkette.
flagsEine Bitmaske von einem oder mehreren der folgenden Flags, die die Behandlung von Anführungszeichen, ungültigen Zeichenfolgen und den genutzten Dokumententyp festlegen. Der Standardwert ist ENT_COMPAT | ENT_HTML401.

Verfügbare flags-Konstanten
KonstantennameBeschreibung
ENT_COMPATTabelle soll Entities für doppelte Anführungszeichen enthalten, aber nicht für einfache.
ENT_QUOTESTabelle soll Entities sowohl für einfache, als auch doppelte Anführungszeichen enthalten.
ENT_NOQUOTESTabelle soll weder Entities für einfache, noch für doppelte Anführungszeichen enthalten.
ENT_HTML401Tabelle für HTML 4.01.
ENT_XML1Tabelle für XML 1.
ENT_XHTMLTabelle für XHTML.
ENT_HTML5Tabelle für HTML 5.
charsetDefiniert die zu verwendende Zeichenkodierung. Standardwert ist ISO-8859-1 in PHP Versionen vor 5.4.0 und UTF-8 in PHP 5.4.0 und neuer.

Für den Gebrauch dieser Funktion sind die Zeichenkodierungen ISO-8859-1, ISO-8859-15, UTF-8, cp866, cp1251, cp1252 und KOI8-R tatsächlich äquivalent, vorausgesetzt der string selbst ist gültig in der Zeichenkodierung, da die von htmlspecialchars() betroffenen Zeichen in allen genannten Zeichenkodierungen an gleicher Position stehen.

Die folgenden Zeichensätze werden mit PHP 4.3.0 und höher unterstützt:

Unterstützte Zeichensätze
ZeichensatzAliasBeschreibung
ISO-8859-1ISO8859-1Westeuropäisch, Latin-1
ISO-8859-15ISO8859-15Westeuropäisch, Latin-9. Enthält das Euro-Zeichen sowie französische und finnische Buchstaben, die in Latin-1(ISO-8859-1) fehlen.
UTF-8 ASCII-kompatibles Multi-Byte 8-Bit Unicode.
cp866ibm866, 866DOS-spezifischer Kyrillischer Zeichensatz.
Dieser Zeichensatz wird ab PHP Version 4.3.2 unterstützt.
cp1251Windows-1251, win-1251, 1251Windows-spezifischer Kyrillischer Zeichensatz.
Dieser Zeichensatz wird ab PHP Version 4.3.2 unterstützt.
cp1252Windows-1252, 1252Windows spezifischer Zeichensatz für westeuropäische Sprachen.
KOI8-Rkoi8-ru, koi8rRussisch. Dieser Zeichensatz wird ab PHP Version 4.3.2 unterstützt.
BIG5950Traditionelles Chinesisch, hauptsächlich in Taiwan verwendet.
GB2312936Vereinfachtes Chinesisch, nationaler Standard-Zeichensatz.
BIG5-HKSCS Big5 mit Hongkong-spezifischen Erweiterungen; traditionelles Chinesisch.
Shift_JISSJIS, 932Japanisch
EUC-JPEUCJPJapanisch
double_encodeWird der Parameter double_encode ausgeschaltet, kodiert PHP bereits existierende HTML-Entities nicht noch einmal. Standardmässig werden jedoch alle Zeichen konvertiert.

    Rückgabewerte:
Der konvertierte string.

Enthält der string eine in dem übergebenen encoding ungültige Code Unit Sequenz, wird eine leere Zeichenkette zurückgegeben, sofern weder das ENT_IGNORE noch das ENT_SUBSITUTE Flag gesetzt sind.

    Beschreibung:
Bestimmte Zeichen haben in HTML eine spezielle Bedeutung und sollten in HTML-Code dargestellt werden, um ihre Bedeutung zu behalten. Diese Funktion liefert einen String zurück, in dem manche dieser Konvertierungen durchgeführt wurden. Die hier vorgenommenen Umwandlungen sind die gebräuchlichsten für die tägliche Web-Programmierung. Sofern Sie eine vollständige Konvertierung der HTML-Zeichen benötigen, sollten Sie stattdessen htmlentities() verwenden.

Diese Funktion ist hilfreich, um vom Benutzer gelieferten Text frei von HTML-Code zu halten, wie z.B. in Foren oder Gästebüchern.

Folgende Umwandlungen werden vorgenommen:
• '&' (Ampersand/kaufmännisches Und) wird zu '&'.
• '"' (doppeltes Anführungszeichen) wird zu '"', wenn ENT_NOQUOTES nicht gesetzt ist.
• "'" (einfaches Anführungszeichen) wird nur zu ''', wenn ENT_QUOTES gesetzt ist.
• '<' (kleiner als) wird zu '&lt;'
• '>' (grösser als) wird zu '&gt;'


    Aktiv in Version:
(PHP 4, PHP 5, PHP 7)

    Hinweis:
Hinweis:

Beachten Sie, dass diese Funktion nur die o.a. Umwandlungen durchführt. Für vollständige Code-Umwandlung verwenden Sie bitte htmlentities().


    Siehe auch:
Gibt die Umwandlungs-Tabelle zurück, die von htmlspecialchars und htmlentities verwendet wird
 
Konvertiert besondere HTML-Auszeichnungen zurück in Buchstaben
 
Entfernt HTML- und PHP-Tags aus einem String
 
Wandelt alle geeigneten Zeichen in entsprechende HTML-Codes um
 
•  nl2br()
Fügt vor allen Zeilenumbrüchen eines Strings HTML-Zeilenumbrüche ein
 

htmlspecialchars_decode() - Beispiel:


Eingabe:
<?php
$neu = htmlspecialchars("<a href='test'>Test</a>", ENT_QUOTES);
echo $neu; // &lt;a href=&#039;test&#039;&gt;Test&lt;/a&gt;
?>


Ausgabe:
<p>this -> "</p>
<p>this -> &quot;</p>

Beschreibung:
Version Beschreibung
5.4.0 Der Standardwert für encoding wurde zu UTF-8 geändert.
5.4.0 Die Konstanten ENT_SUBSTITUTE, ENT_DISALLOWED, ENT_HTML401, ENT_XML1, ENT_XHTML und ENT_HTML5 wurden hinzugefügt.
5.3.0 Die Konstante ENT_IGNORE wurde hinzugefügt.
5.2.3 Der Parameter double_encode wurde hinzugefügt.
4.1.0 Der Parameter encoding wurde hinzugefügt.
htmlspecialchars_decode() - Beispiel 2:


Eingabe:
<?PHP
$string = '\' " & < >';
echo htmlspecialchars ( $string, ENT_QUOTES );
?>


Ausgabe:
' " & < >

Achtung - Dieses geh�rt nicht zur Ausgabe. Der HTML-Quellcode sieht f�r die obere Ausgabe wie folgt aus:

&#039; " &amp; &lt; &gt;

Beschreibung:
Mit htmlspecialchars() werden bestimmte Sonderzeichen in den daf�r vorgesehenen HTML-Code umgewandelt. Der zweite Parameter (quote_style) ist optional und erst ab der Version 3.0.17 bzw. 4.0.3 verf�gbar. Dieser bewirkt, dass Anf�hrungszeichen mit ber�cksichtigt werden. Standardm�ssig ist der Wert ENT_COMPAT aktiviert. Falls Sie eine vollst�ndige Umwandlung der HTML-Zeichen ben�tigen, so nutzen Sie die Funktion htmlentities().

Beschreibung:
Version Beschreibung
5.4.0 Der Standardwert für encoding wurde zu UTF-8 geändert.
5.4.0 Die Konstanten ENT_SUBSTITUTE, ENT_DISALLOWED, ENT_HTML401, ENT_XML1, ENT_XHTML und ENT_HTML5 wurden hinzugefügt.
5.3.0 Die Konstante ENT_IGNORE wurde hinzugefügt.
5.2.3 Der Parameter double_encode wurde hinzugefügt.
4.1.0 Der Parameter encoding wurde hinzugefügt.
String-Funktionen