什么是标记语言?
标记语言是一种系统,用于定义数字文档中内容的结构、表示和/或用途,以便计算机程序可以正确解释和显示内容。
标记语言使用特定词汇、符号和/或语法规则对文本进行编码。
例如,HTML(超文本标记语言)中的 <h1>
标记表示括起来的文本是顶级标题。
搜索引擎可以使用此信息来更好地了解您页面的主题。虽然浏览器可以使用此信息来应用相关的样式。
以下是 H1 在页面和后端的外观:
标记语言可以:
- 使您的网站对搜索引擎更友好
- 确保您的内容在不同技术上一致地显示
- 提高网站可访问性
标记语言与编程语言
标记语言和编程语言都是用于构建、显示和作内容或数据的计算机语言类型,但它们不是一回事。
编程语言提供计算机可以执行的逻辑。这使程序能够对输入做出反应、执行计算、做出决策和完成任务。
例如,您可以对按钮进行编程,使其在用户悬停时更改颜色。
相比之下,标记语言只能在加载元素时定义元素的结构和外观。标记无法动态更改元素的状态或行为。
Python、JavaScript 和 PHP 是编程语言的示例。
标记语言的类型
标记语言可以是语义语言、表示语言、过程语言或这些类型的组合。
语义标记(或描述性标记)通过标记内容的结构和用途来为内容提供含义。这可以帮助浏览器、搜索引擎和开发人员正确解释内容。
例如,在 XML 中 <author>John Doe</author>
,将 “John Doe” 标识为文章的作者。但标记不会影响此文本的呈现。
表示标记控制内容的视觉外观,以便用户以特定方式查看内容。此标记定义文本的外观,而不指定系统应如何呈现文本。
例如,在 HTML 中,将<b>Bold Text</b>
包含的文本标记为粗体,但不指示浏览器应该使用的确切过程来实现该外观。
过程标记提供了有关如何处理、格式化或显示内容的分步命令。此标记不是定义外观,而是指导系统如何处理文本。
例如,在 LaTeX 中,指示排版系统根据其后端处理规则应用粗体字体粗细。
7 标记语言示例
一些最广泛使用的标记语言包括 HTML、XML、markdown、SVG、LaTeX、SGML 和 XHTML。
让我们更详细地探讨这些标记语言:
1. HTML
HTML 是用于构建和组织网页内容的标准标记语言。
最新版本的 HTML 称为 HTML5。
您可以通过将内容包含在 HTML 标签中来定义 HTML 文档中的元素。
像这样:
- 段落的
<p>
标签 <a>
超链接的标签<img>
标签<h1>
标记<title>
页面标题的标签
您还可以使用语义 HTML 来标记页面的不同部分,例如页眉、导航菜单和页脚。这有助于搜索引擎、辅助技术(如屏幕阅读器)和开发人员了解内容的用途。
以下是非语义 HTML 与语义 HTML 的比较:
许多种类的 HTML 标记都包含属性,这些属性提供有关元素的其他信息。
属性具有名称和值。例如,href 属性用于定义超链接的目的地:
HTML 通常与 JavaScript(一种添加交互性的编程语言)和 CSS(一种定义 HTML 内容样式的样式表语言)一起使用。
2. XML
XML(可扩展标记语言)用于存储和传输数据。
这种标记语言在 SEO 中很重要,因为 SEO 专业人员使用它来创建 XML 站点地图。
您的 XML 站点地图应列出您网站上您希望搜索引擎索引的所有页面(即,添加到可能的搜索结果的数据库中)。XML 格式可帮助搜索引擎爬网程序读取文件。
在 XML 中,您不仅限于一组预定义的标记。您可以创建自定义标签来描述数据。
下面是一个简单系统的示例,该系统组织和保存有关文章的结构化信息数据:
<article>
<title>What Is a Markup Language?</title>
<author>Rachel Handley</author>
<year>2025</year>
</article>
3. Markdown
Markdown 是一种轻量级标记语言,它使用符号在纯文本编辑器中设置文本格式。
该语言的语法简单,非常适合在不同环境中快速格式化和易于阅读。
Markdown 在文字处理器、即时消息应用程序、在线论坛、文档工具、笔记应用程序、开发人员平台、博客网站和项目管理工具中得到广泛支持。
一些平台(如 Reddit 和 GitHub)使用自己的 markdown 版本。
4. SVG
SVG(可缩放矢量图形)是一种用于描述矢量图形的标记语言。
矢量图形是从数学方程式创建的图像。这意味着它们只能用于相对简单的图形,但这些图形可以在不损失质量的情况下调整大小。
例如,下面的 SVG 代码创建了一个蓝色圆圈,该圆圈占据了容器最小边的 80%,并在容器中居中。
<svg viewBox="0 0 100 100" width="100%" height="100%" xmlns="http://www.w3.org/2000/svg">
<circle cx="50" cy="50" r="40" fill="blue" />
</svg>
SVG 图像在任何大小下都保持清晰,并且通常比光栅图形(如 JPEG 和 PNG)加载得更快。这使得 SVG 成为徽标、图标、图表和其他简单图形的不错选择。
5. LaTeX
LaTeX 是一种程序标记语言,通常用于准备科学论文、研究文章和数学内容——通常为 PDF 格式。
该语言允许用户使用适当的符号显示复杂的方程,如下所示:
LaTeX 还可以更轻松地处理引文、书目、脚注和其他在其他标记语言中难以管理的元素。
6. SGML
SGML(标准通用标记语言)是用于创建标记语言的框架,它是 HTML 和 XML 的基础。
要从 SGML 开始,请制作文档类型定义 (DTD)。DTD 概述了文档结构,并列出了您将使用的元素、属性和实体。
然后,您可以根据这些既定的准则编写您的文档。
下面是一个简短的示例:
<!DOCTYPE book [
<!ELEMENT book (title, chapter+)>
<!ELEMENT title (#PCDATA)>
<!ELEMENT chapter (#PCDATA)>
]>
<book>
<title>Sample SGML Document</title>
<chapter>Introduction to SGML</chapter>
</book>
如今,大多数开发人员更喜欢使用 HTML 或 XML,而不是 SGML。因为 HTML 和 XML 更加用户友好且得到广泛支持。
7. XHTML
XHTML 是 HTML 和 XML 的混合体,它将 HTML 的表示功能与 XML 的严格语法规则合并在一起。
开发 XHTML 是为了提高代码和浏览器的兼容性。但是,随着 HTML5 的引入,其中许多改进变得多余了。
由于 HTML5 的适应性和跟上不断发展的数字环境的能力,大多数开发人员现在使用 HTML5 而不是 XHTML。
我应该学习标记语言吗?
学习相关的标记语言可以帮助您编辑文档、构建内容、管理网站或设置学术论文的格式,而无需依赖外部帮助。
但是,许多平台都提供了所见即所得(所见即所得)编辑器。这意味着您可以直观地编辑内容,并且平台会自动生成基础标记语言。
例如,在 WordPress 可视化编辑器中应用 “H1” 样式会在页面的 HTML 代码中应用 <h1>
标签:
如果您的项目需要高级功能、自定义开发或复杂的集成,请考虑聘请知识渊博的 Web 开发人员来处理编码。这样做有助于确保效率、可扩展性和专业品质的结果。
查找并修复您网站上的标记错误
仅一个放错位置的元件就可能导致标记语言错误,因此在发布前后检查您的内容至关重要。
Semrush 的 Site Audit(网站诊断)工具会标记可能影响您网站 SEO 性能的标记问题。如:
- XML 站点地图格式错误
- HTML 错误(例如,缺少标题标签或文档类型声明)
- SVG 图像文件错误
该工具还可以识别您的技术和页面 SEO 的其他问题,提供有关如何以及为何解决这些问题的建议,并让您为团队创建任务。