超文本标记语言 (HTML)

TL;博士
HTML(超文本标记语言)是一种用于创建网页的语言。一些页面可以直接用 HTML 编写,而另一些页面可能使用页面构建器或其他工具来创建也产生 HTML 输出的网页,而这些输出又可以被浏览器读取。
HTML 是什么意思?
HTML 代表超文本标记语言,它是用于创建网页的语言。它使用标记来定义和样式化元素。例如,它可以定义字体、颜色、位置、链接等。尽管大多数网站建设者不直接用 HTML 编写,但 Web 浏览器读取和解释的最终输出都是 HTML 格式。这就是为什么当右键单击任何网页并选择“查看页面源代码”时,结果窗口中的第一行文本应该是 <!doctype html>。
HTML页面的结构是什么?
虽然结构可能会有所不同,但您应该在任何 HTML 中找到的一些元素如下(带有斜体解释)。通过右键单击任何网页并选择“查看页面源”来检查任何网页:
<!DOCTYPE html> -这向网络浏览器显示这是一个它可以读取的 HTML 文件
<html lang="en"> -这显示了网页的编写语言
<head> -这标志着头部部分的开始,一般代码放置的地方
<title>页面标题</title> -这是一个显示页面标题的元标记,显示在浏览器选项卡中
<meta name="description" content="..." /> -这用于描述页面的内容,用于搜索引擎
<meta name="viewport" content="width=device-width, initial-scale=1, minimum-scale=1, user-scalable=0" /> -这是一个告诉网页应该如何显示的命令各种屏幕尺寸
<meta name="robots" content="index,follow" /> -这告诉爬取页面的机器人他们可以将其编入索引并将其添加到搜索引擎结果中
<link rel="stylesheet" type="text/css" href="/css/style/style.css"> -这会将 HTML 连接到 CSS 文件,其中放置了更详细的文本样式
<script src="/js/random.js" type="text/javascript"></script> -连接到一个 JavaScript 文件,用于在网页上运行一个动作
<link rel="canonical" href="https://yourpage.com"/> -如果有类似内容的页面或者该页面可以在多个 URL 中找到,这将向爬虫显示要进入哪个 URL为授权目的而记账
</head> -这会关闭头部
<body> -这将打开正文部分,其中放置实际页面内容
<div class="container"> -这会打开一个名为 container 的部分,它通常会为内容创建框架
<a href="https://yoursiteshomepage.com"><img class="navbar-brand-logo-normal" src="/images/logo.svg" alt="alt text" height="52" width ="180"></a> -这是放置链接到您主页的徽标图像的一种方式
<div class=”first-text”>这些是实际显示在您的网站上的第一个单词</div> -一些可以在连接的 CSS 文件中设置样式的文本
...
</正文>