自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(467)
  • 收藏
  • 关注

原创 OpenShift / RHEL / DevSecOps 汇总目录

文章目录OpenShiftHands-onLabQuarkusGitOpsIstioServiceMesh系列Istio-TutorialServiceMeshKnatvie系列Knative入门Knative-TutorialOpenShiftHands-onLabHands-onLab(0)-教程说明和准备环境Hands-onLab(1)-多种方法部署运行应........................................................

2020-03-23 23:50:58 18619 4

原创 OpenShift AI - 使用 NVIDIA Triton Runtime 运行模型

说明:本文已经在 OpenShift 4.18 + OpenShift AI 2.19 的环境中验证。

2025-07-04 17:21:36 959

原创 OpenShift AI - 用 Open-WebUI 统一访问 OpenShift AI 上的 LLM 模型

说明:本文已经在 OpenShift 4.18 + OpenShift AI 2.19 的环境中验证。

2025-06-30 09:16:29 645

原创 OpenShift AI - 为模型训练定制 Notebook 镜像

如果 OpenShift AI Workbench 的默认镜像没有用户使用的库,或者用户使用的库别于默认镜像提供的库版本,亦或用户需要使用需要使用一些应用程序,但无法直接在运行环境中安装(用户没有 root 访问权限,而这些操作需要 root 访问权限),我们可以为 Workbench 定制 Notebook 镜像已实现定制的需求。

2025-06-03 09:55:30 956

原创 OpenShift AI - 启用过时版本的 Notebook 镜像

本文介绍了在OpenShift AI 2.19环境中查看可用Notebook镜像的方法。通过控制台可在Workbench或Applications中查看内置镜像,包括TensorFlow 2025.1和2024.2版本,并支持查看镜像所含软件包。RedHat每6个月会升级镜像并淘汰旧版本。命令行方式可通过oc get is查看所有镜像,如TensorFlow还包含2024.1、2023.2等更早版本。文章还提供了检查镜像标签和对应地址的YAML输出示例。

2025-06-01 13:42:35 503

原创 OpenShift AI - 模型下载工具

说明:本文已经在 OpenShift 4.18。

2025-05-19 08:39:04 495

原创 OpenShift AI - 用 ModelCar 构建容器化模型,提升模型弹性扩展速度

OpenShift AI - 用 ModelCar 构建容器化模型,提升模型弹性扩展速度

2025-05-15 11:39:28 735

原创 OpenShift AI - 在控制台增加 NVIDIA GPU 监控功能

说明:本文已经在 OpenShift 4.18 的环境中验证。

2025-05-08 08:39:56 913

原创 OpenShift AI - 模型注册管理

说明:本文已经在 OpenShift 4.18 + OpenShift AI 2.19 的环境中验证。

2025-05-07 18:26:29 1043

原创 OpenShift AI - 在 OpenShift 和 OpenShift AI 上运行 LLM 推理服务

说明:本文已经在 OpenShift 4.18 + OpenShift AI 2.19 的环境中验证。

2025-05-07 08:36:33 1079

原创 OpenShift AI - OpenShift 支持的 NVIDIA GPU 共享和分区技术 2

本文已经在 OpenShift 4.18 的环境中验证。

2025-05-06 14:48:31 908

原创 OpenShift AI - OpenShift 支持的 NVIDIA GPU 共享和分区技术 1

将一个物理 GPU 进行虚拟化,分配给不同的 VM 使用。多个 VM 共享一个物理 GPU 设备来提升 GPU 的使用率。优点缺点MIG 可将单个物理 GPU 划分为多个独立实例,每个实例都有自己的计算资源、内存和性能配置文件,隔离性最高。优点缺点MPS 可用于多个 CUDA 应用程序并发共享单个 GPU。优点缺点时间片技术可将 GPU 资源划分为时间间隔 “切片”,并按顺序分配给不同的用户或进程。优点缺点https://develope

2025-05-06 10:52:20 922

原创 OpenShift 4 - 卷快照和卷克隆

说明:本文已经在OpenShift 4.18 环境中验证。

2025-04-24 08:40:54 998

原创 JBoss EAP 8 - 配置高可用集群

本文介绍 JBoss EAP 高可用集群配置。建议先通过《JBoss EAP 8 - 概念篇》了解 Managed Domai 及相关概念,并通过《JBoss EAP 8 - Standalone 运行模式》掌握初步 JBoss EAP 的配置和操作。

2025-03-31 10:52:54 776

原创 JBoss EAP 8 - 使用 Domain 运行模式

本文介绍以受管域 (Managed Domain) 方式运行的 JBoss EAP。建议先通过《JBoss EAP 8 - 概念篇》了解 Managed Domai 及相关概念,并通过《JBoss EAP 8 - Standalone 运行模式》掌握初步 JBoss EAP 的配置和操作。

2025-03-28 08:26:20 1002

原创 JBoss EAP 8 - 使用 Standalone 运行模式

先将 https://github.com/RedHatQuickCourses/eap-qc-apps/releases/download/eap8-lp/temperature-converter.war 下载到本地。除了可直接修改 EAP_HOME/bin/standalone.conf 文件中的 JBOSS_JAVA_SIZING 参数外,还可通过以下方法设置 JBoss EAP Server 实例的 Java 参数。由于 zip 安装方式支持在离线主机中安装多份运行环境,因此最灵活性。

2025-03-26 14:06:52 817

原创 JBoss EAP 8 - 概念篇

JBoss EAP 7/8 是符合 Jakarta EE 8/10 规范的 Java 应用服务器。在运行 Java 应用方面 JBoss EAP 的能力和 Weblogic Server 大致相当,但在功能架构方面,两者有部分稍区别。本文主要介绍 JBoss EAP 在功能架构方面的核心概念,尤其是和 Weblogic Server 差异部分。

2025-03-25 16:44:28 836

原创 RHEL AI (2) - 用 InstructLab 训练 Granite 模型

已在 InstructLab 0.24.1 验证。

2025-02-27 13:44:06 933

原创 RHEL AI (1) - 在 InstructLab 上运行 Granite 模型

它是 IBM 在生成式 AI 和自然语言处理领域的最新成果之一,专注于通过指令(Instruction)驱动的方式提升模型的能力。:在下载的模型中前三个是 GGUF 类型模型,而 granite-embedding-125m-english 是为运行 RAG 而用的 Safetensor 类模型。:本文使用的是社区版 InstructLab。使用 InstructLab 运行和训练 Granite 模型的迭代过程如下图,本文实现的是红色部分的操作。为了运行模型,可以直接下载模型文件,也可以下载模型的镜像。

2025-02-25 14:58:37 684

原创 OpenShift Dev Spaces 7 - 使用 AI 代码生成插件

本文在 OpenShift 4.18 + Dev Spaces 3.18.1 验证。

2025-02-24 08:28:46 911

原创 OpenShift Dev spaces 8 - 在一个 Workspace 中同时开发多个项目

本系列在 OpenShift 4.17 + Dev Spaces 3.17.0 验证。

2025-02-11 14:52:09 315

原创 RHEL故障诊断4 - 根据 Kdump 转储文件分析内核崩溃原因

说明:本文针对 Linux 的版本为 RHEL 8。

2025-02-11 14:35:18 888

原创 RHEL故障诊断3 - 为系统配置 Kdump

Kdump 是 Linux 系统中的一种重要机制,用于在系统内核崩溃时收集关键信息以帮助分析问题。当系统出现故障时内核崩溃转储是唯一可用的信息,因此在关键任务环境中运行 Kdump 非常重要。在系统启动时,Kdump 会预留一部分物理内存(称为拯救内核空间),专门用于加载 Kdump 用到的第二个内核。这个备用内核与正常运行的主内核相互独立。当系统出现故障时,Kdump 会使用 kexec 调用启动到第二个内核,即捕获内核,而无需重启。

2025-02-11 14:34:41 685

原创 RHEL故障诊断2 - 配置 core dump,分析应用故障

说明:本文针对 Linux 的版本为 RHEL 8。

2025-02-10 14:17:20 454

原创 RHEL故障诊断1 - Kdump 和 core dump 的区别

Kdump 和 core dump 都是当 Linux 出现异常时用来收集信息以帮助分析问题的机制,但它们在适用领域、触发条件、收集内容等方面有明显区别。

2025-02-10 14:15:08 385

原创 RHEL故障诊断5 - 如何分析 sosreport 排除系统故障

它能从sosreport目录中收集系统的bios、os、CPU、内存、网络、存储、kdump等配置信息。在sosreport中的sos_commands/kernel/dmesg文件和var/log/dmesg文件内都包含了Kernel消息,但它们在生成方式和包含的内容范围有所不同。还可在sos_commands/logs中的journalctl_–no-pager文件中查找关键字(如error、panic、oom、reboot等)。

2025-01-20 10:00:30 1308

原创 RHEL HA(3)- 集群管理

在 node1 节点运行以下命令,可以查看集群的 cib 配置信息。

2025-01-17 10:00:21 930

原创 RHEL - systemd-journald 和 rsyslog 日志系统

rsyslog 和 systemd-journald 是 RHEL 支持的两种不同的日志系统。 - 在 RHEL 6 中使用的是 rsyslog 日志系统,由 rsyslog 读取所有放入 /dev/log 中的日志。 - 在 RHEL 7/8/9 中使用的是 systemd-journald 日志系统,由 systemd-journald 读取所有放入 /dev/log 中的日志。另外,在 RHEL 7/8/9 中还可以继续使用 rsyslog,且 systemd-journald 可配合 rsysl

2025-01-16 15:13:53 916

原创 RHEL - 配置主备 NIC Bonding

RHEL - 配置主备 NIC Bonding。

2025-01-10 09:03:44 771

原创 RHEL HA(1)- 概念篇

当半数以上的集群节点在线时,集群就达到了法定的仲裁数,集群还可以继续运行在多数部分里。高可用集群可消除单点故障,并在一个节点无法运行时将服务从一个集群节点转移到另一个节点,而集群的客户端感知不到集群的节点故障。如果高可用集群的服务会读写数据(通过读写挂载文件系统),当集群从一个节点转移另一个节点接管服务控制权时,高可用集群必须保持数据的完整性。如果负载均衡集群中的一个节点无法运行,负载均衡软件会检测到故障并将请求重定向到其他集群节点,而集群的客户端感知不到集群的节点故障。

2025-01-09 13:58:16 1041

原创 OpenShift Dev Spaces 6 - 为 Workspace 设置存储使用策略

在 OpenShift Dev Spaces Operator 中创建 CheCluster 实例的时候,可以在 Development environments 设置 storage 属性。可在 Devfile 中设置 controller.devfile.io/storage-type 属性来覆盖 Workspace 缺省的存储配置。

2024-12-30 09:29:01 852

原创 OpenShift 4 可观测性 - 用 Cluster Observability Operator 全面观测集群

说明:本文已经在 OpenShift 4.17 + COO 0.4.1 的环境中验证。

2024-12-20 08:28:05 899

原创 OpenShift 4 - 多云管理(2) - 配置多集群观察功能

本文在 OpenShift 4.17 + RHACM 2.12 环境中进行验证。

2024-12-17 14:24:12 1298

原创 OpenShift Dev Spaces 5 - 安全相关设置

本系列在 OpenShift 4.17 + Dev Spaces 3.17.0 验证。

2024-12-13 09:20:43 761

原创 OpenShift Dev Spaces 4 - Plug-in 和 Plug-in Registry

本系列在 OpenShift 4.17 + Dev Spaces 3.17.0 验证。

2024-12-06 15:36:57 615

原创 OpenShift Dev Spaces 3 - Workspace 运行环境和统一开发镜像 UDI

本系列在 OpenShift 4.17 + Dev Spaces 3.17.0 验证。

2024-12-05 10:28:30 744

原创 OpenShift Dev Spaces 2 - Devfile 和 Devfile Registry

Devfile 是由 Red Hat、AWS、JetBrains 和 GitLab 联合贡献的一个开源项目,目前已是 CNCF 的沙盒项目。Devfile 是基于 YAML 的配置文件,用于定义和描述特定开发环境所需的组件、工具和设置。它能让开发人员以标准格式描述他们的环境,它可在任何支持 Devfile 规范的 CDE 平台上进行共享和复制,以确保整个团队拥有相同的用户体验以及构建、运行和部署行为。projects:开发环境中需要克隆或初始化的 Git Repo。

2024-12-03 13:45:03 703

原创 OpenShift Dev Spaces 1 - 安装 Dev Spaces 在线开发环境

OpenShift Dev Spaces 是一个在 OpenShift 上提供的基于 Web 的应用开发环境。它以容器的方式为开发人员提供了一个云开发环境 (CDE) ,开发人员能够以在线的方式基于流行编程语言和技术框架开发应用。OpenShift Dev Spaces 基于红帽主导的 Eclipse Che 开源项目,其所有功能都内置于 OpenShift。

2024-12-02 10:01:19 599

原创 RHEL HA(2)- 实现 httpd 服务主备群集

RHEL High Availability Add-On 由以下组件组成,这些组件可提供高可用性服务。 1. 集群基础结构 - 提供集群管理功能:配置文件管理、成员资格管理、锁管理和保护。 2. 高可用性服务管理 - 提供当一个节点不可操作时,服务从一个集群节点切换到另外一个节点的功能。 3. 集群管理工具 - 提供用于集群基础结构组件、高可用性和服务管理组件的配置和管理工具。

2024-11-08 08:15:51 1016

原创 OpenShift 4 - 云原生应用容灾 - 概念篇

Metro-DR 解决方案使用同步复制,它同时向主站点和从站点的存储写入数据,使站点之间的数据始终保持同步,因此环境必须满足存储提供商的吞吐量和延迟要求。主集群是活动集群,从集群是被动集群,但如果主集群不可用,从集群就会变成活动集群。Metro-DR 还需有主集群和从集群都能看到的延伸存储供应程序, 存储供应程序负责在主集群和从集群之间同步卷。在典型的 Regional-DR 中有三个集群:一个中心集群、一个主集群和一个从集群。主集群是活动集群,从集群是被动集群。

2024-11-05 11:11:39 1189

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除