HTML中段落标签和换行标签分别是,HTML 基本标签

本文介绍了HTML的基本元素,包括标题标签(~)用于设置页面标题和层级结构,图像标签(img)及其SrC、alt、width和height属性用于插入和控制图片,段落标签(p)组织文本内容,以及换行标签(br)实现非段落内的换行。了解这些基础知识对于创建和格式化网页至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基本标签

HTML页面中内容是由HTML标签组织起来的,如页面中的文本、图像、Flash视频文件等都是通过HTML标签合理地显示在页面的各个位置。

58529dd792442008c927ac3dd42e25df.png

1 标题标签~

标题标签表示一段文字的标题(主题),并且支持多层次的内容结构。HTNL.共提供了6级标题,分别为~,并赋予了标题一定的外观,所有标题字体加粗,其中山字号最大,字号最小.

2.图像标签

在网页中常用的图像格式有4种,即JPG、GIF、BMP.PNG,其中使用比较多的是JPG、GIF和PNG,大多数浏览器都可以显示这些图像。

显示图像的语法:

在语法中:

a、SrC属性:表示显示图像的地址。

b、alt属性:指定图像的替代文本,当图像无法显示时(如图片路径错误或网速太慢等)替代显示的文本,这样,即使图像无法显示,用户还可以看到网页丢失的信息,所以为页面上的图像都加上替换文本属性是个好习惯,这样有助于更好地显示信息,并且对于那些使用纯文本浏览器的人来说是非常有帮助的。

c、width属性:表示图像宽度.

d、height属性:表示图像高度。

3.段落标签

顾名思义,段落标签表示将一段文字组成一系列段落内容,这样做的目的是内容应用某些格式和布局,使各个段落的逻辑更清晰明了。在HTML文档中,段落通过标签定义。段落标签表示段落的开始,表示段落的结束。

4.换行标签

在希望不产生一个新段落的情况下进行换行,则使用标签。是一个空的HTML标签,由于关闭标签没有任何意义,因此它没有结束标签。

注意:

使用和的结果一样,在XHTML以及未来的HTML版本中,根据W3C规范,不允许使用没有结束标签的HTML元素,因此使用页面更规范,有更长远的保障。

5.水平线标签

水平线标签表示一条水平线,注意该标签与标签一样,没有结束标签,直接使用表示标签的开始和结束。

import os import re import extract_msg from docx import Document def clean_text(text): """ 清理文本中的非法 XML 字符 移除控制字符(除了制表符、换行回车符) NULL 字节 """ # 保留制表符(\t)、换行符(\n)、回车符(\r) # 移除其他控制字符(ASCII 0-31 中除了 \t, \n, \r 的字符) # 移除 NULL 字节 (\x00) return re.sub( r'[\x00-\x08\x0b\x0c\x0e-\x1f]', '', text ) def msg_to_docx(msg_path, output_dir): """转换单个 MSG 文件为 Word""" try: msg = extract_msg.Message(msg_path) doc = Document() # 添加邮件元数据 doc.add_heading(f"主题: {msg.subject}", level=1) doc.add_paragraph(f"发件人: {clean_text(msg.sender)}") doc.add_paragraph(f"收件人: {clean_text(msg.to)}") doc.add_paragraph(f"日期: {msg.date}") # 添加邮件正文(清理非法字符) doc.add_heading("正文内容", level=2) # 处理 HTML 内容(如果可用) body_content = msg.body if hasattr(msg, 'htmlBody') and msg.htmlBody: try: # 优先使用 HTML 内容 import html2text h = html2text.HTML2Text() h.ignore_links = True h.ignore_images = True h.ignore_emphasis = True body_content = h.handle(msg.htmlBody) except ImportError: print("提示: 安装 html2text 可获取更好格式 (pip install html2text)") # 清理并添加正文 cleaned_body = clean_text(body_content) doc.add_paragraph(cleaned_body) # 保存 Word 文件 filename = os.path.splitext(os.path.basename(msg_path))[0] + ".docx" output_path = os.path.join(output_dir, filename) doc.save(output_path) msg.close() print(f"已转换: {os.path.basename(msg_path)} -> {filename}") return True except Exception as e: print(f"转换失败: {os.path.basename(msg_path)} - {str(e)}") return False def batch_convert(folder_path, output_dir): """批量转换文件夹内所有 MSG 文件""" if not os.path.exists(output_dir): os.makedirs(output_dir) success_count = 0 fail_count = 0 for filename in os.listdir(folder_path): if filename.lower().endswith('.msg'): filepath = os.path.join(folder_path, filename) if msg_to_docx(filepath, output_dir): success_count += 1 else: fail_count += 1 print("\n" + "=" * 50) print(f"转换完成! 成功: {success_count}, 失败: {fail_count}") print("=" * 50) # 使用示例 - 注意使用原始字符串或双反斜杠 if __name__ == "__main__": input_folder = r"C:\邮件存档" # 使用原始字符串 output_folder = r"C:\转换结果" # 使用原始字符串 # 验证路径是否存在 if not os.path.exists(input_folder): print(f"错误: 输入目录不存在 - {input_folder}") else: print(f"开始转换: {input_folder} -> {output_folder}") batch_convert(input_folder, output_folder) 转出的word内容换行太多,调整下代码
最新发布
06-17
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值