0%

cuda 中核函数执行使用多线程并行(SIMD)的方式,同时计算多个数据,因此核函数的线程管理以及相应的任务分配就显得尤为重要。

阅读全文 »

CUDA 函数前缀作为 CUDA 编程中一种特殊的使用技巧,其具有一定的限制意义。

阅读全文 »

标准日志库 logging 即使不是 Python 中最好的日志库,也是使用最多的日志库了,我个人非常喜欢。本文较为全面的总结了 logging 库的知识点。

阅读全文 »

TensorRT(TRT) 作为一种能显著加快深度学习模型 inference 的工具,如果能够较好的利用,可以显著提高我们的 GPU 使用效率和模型运行速度。

阅读全文 »

最近看到一个进程状态的博客写的比较好,转载记录复习,顺便加点自己的理解注释,形成了这篇文章。

阅读全文 »