CUDA 多线程并行 发表于 2019-10-30 更新于 2025-06-25 分类于 C/C++ 本文字数: 3k 阅读时长 ≈ 5 分钟 cuda 中核函数执行使用多线程并行(SIMD)的方式,同时计算多个数据,因此核函数的线程管理以及相应的任务分配就显得尤为重要。 阅读全文 »
C++11 的随机数 发表于 2019-10-30 更新于 2025-06-25 分类于 C/C++ 本文字数: 2k 阅读时长 ≈ 3 分钟 C++11 带来了丰富便捷的随机数生成方法。 阅读全文 »
程序绑定 CPU 核心 发表于 2019-09-26 更新于 2025-06-25 分类于 C/C++ 本文字数: 2.2k 阅读时长 ≈ 4 分钟 有时候需要将程序绑定到固定 CPU 的某个核心上运行。 阅读全文 »
OpenBLAS 中矩阵运算函数学习 发表于 2019-09-25 更新于 2025-06-25 分类于 C/C++ 本文字数: 1.1k 阅读时长 ≈ 2 分钟 GEMM 是矩阵乘法最成熟的优化计算方式,也有很多现成的优化好的库可以调用。 阅读全文 »
CUDA 函数前缀 发表于 2019-09-11 更新于 2025-06-25 分类于 C/C++ 本文字数: 866 阅读时长 ≈ 1 分钟 CUDA 函数前缀作为 CUDA 编程中一种特殊的使用技巧,其具有一定的限制意义。 阅读全文 »
Python 日志库 logging 总结 发表于 2019-09-11 更新于 2025-06-25 分类于 Python 本文字数: 11k 阅读时长 ≈ 18 分钟 标准日志库 logging 即使不是 Python 中最好的日志库,也是使用最多的日志库了,我个人非常喜欢。本文较为全面的总结了 logging 库的知识点。 阅读全文 »
TensorRT 实战教程 发表于 2019-09-09 更新于 2025-06-25 分类于 DeepLearning 本文字数: 7.8k 阅读时长 ≈ 13 分钟 TensorRT(TRT) 作为一种能显著加快深度学习模型 inference 的工具,如果能够较好的利用,可以显著提高我们的 GPU 使用效率和模型运行速度。 阅读全文 »
win10 虚拟机黑屏卡死 发表于 2019-08-31 更新于 2025-06-25 分类于 Windows 本文字数: 328 阅读时长 ≈ 1 分钟 在 windows10 上面装好 virtualbox 虚拟机之后卡死黑屏,开不了机。 阅读全文 »
Socket 读写就绪条件 发表于 2019-08-27 更新于 2025-06-25 分类于 Linux 本文字数: 1.6k 阅读时长 ≈ 3 分钟 关于 Socket 的读写就绪条件。 阅读全文 »
僵尸进程和孤儿进程总结 发表于 2019-08-26 更新于 2025-06-25 分类于 Linux 本文字数: 5.3k 阅读时长 ≈ 9 分钟 最近看到一个进程状态的博客写的比较好,转载记录复习,顺便加点自己的理解注释,形成了这篇文章。 阅读全文 »