Blog | Edward Andres Sandoval Pineda

Technical Blog

Deep dives into ML experiments, model optimization, deployment strategies, and research papers.

A practical guide to optimizing transformer model inference for production deployment, covering quantization, distillation, and ONNX Runtime.