diff --git a/tensorflow_io/core/BUILD b/tensorflow_io/core/BUILD
index 07bdc0b36..06a8205e2 100644
--- a/tensorflow_io/core/BUILD
+++ b/tensorflow_io/core/BUILD
@@ -135,6 +135,7 @@ cc_binary(
         "//tensorflow_io/json:json_ops",
         "//tensorflow_io/lmdb:lmdb_ops",
         "//tensorflow_io/mnist:mnist_ops",
+        "//tensorflow_io/parquet:parquet_ops",
         "//tensorflow_io/prometheus:prometheus_ops",
         "//tensorflow_io/text:text_ops",
         "@libarchive",
diff --git a/tensorflow_io/parquet/BUILD b/tensorflow_io/parquet/BUILD
index 5f74f1547..f6768043f 100644
--- a/tensorflow_io/parquet/BUILD
+++ b/tensorflow_io/parquet/BUILD
@@ -7,18 +7,16 @@ load(
     "tf_io_copts",
 )
 
-cc_binary(
-    name = "python/ops/_parquet_ops.so",
+cc_library(
+    name = "parquet_ops",
     srcs = [
-        "kernels/parquet_input.cc",
+        "kernels/parquet_kernels.cc",
         "ops/parquet_ops.cc",
     ],
     copts = tf_io_copts(),
-    linkshared = 1,
+    linkstatic = True,
     deps = [
         "//tensorflow_io/core:dataset_ops",
         "@arrow",
-        "@local_config_tf//:libtensorflow_framework",
-        "@local_config_tf//:tf_header_lib",
     ],
 )
diff --git a/tensorflow_io/parquet/__init__.py b/tensorflow_io/parquet/__init__.py
index e3bb3bba5..4f7ca258d 100644
--- a/tensorflow_io/parquet/__init__.py
+++ b/tensorflow_io/parquet/__init__.py
@@ -15,6 +15,8 @@
 """Parquet Dataset.
 
 @@ParquetDataset
+@@read_parquet
+@@list_parquet_columns
 """
 
 from __future__ import absolute_import
@@ -22,11 +24,15 @@
 from __future__ import print_function
 
 from tensorflow_io.parquet.python.ops.parquet_ops import ParquetDataset
+from tensorflow_io.parquet.python.ops.parquet_ops import read_parquet
+from tensorflow_io.parquet.python.ops.parquet_ops import list_parquet_columns
 
 from tensorflow.python.util.all_util import remove_undocumented
 
 _allowed_symbols = [
     "ParquetDataset",
+    "read_parquet",
+    "list_parquet_columns",
 ]
 
 remove_undocumented(__name__, allowed_exception_list=_allowed_symbols)
diff --git a/tensorflow_io/parquet/kernels/parquet_input.cc b/tensorflow_io/parquet/kernels/parquet_input.cc
deleted file mode 100644
index e1808d559..000000000
--- a/tensorflow_io/parquet/kernels/parquet_input.cc
+++ /dev/null
@@ -1,315 +0,0 @@
-/* Copyright 2018 The TensorFlow Authors. All Rights Reserved.
-
-Licensed under the Apache License, Version 2.0 (the "License");
-you may not use this file except in compliance with the License.
-You may obtain a copy of the License at
-
-    http://www.apache.org/licenses/LICENSE-2.0
-
-Unless required by applicable law or agreed to in writing, software
-distributed under the License is distributed on an "AS IS" BASIS,
-WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-See the License for the specific language governing permissions and
-limitations under the License.
-==============================================================================*/
-
-#include "kernels/dataset_ops.h"
-#include "tensorflow/core/lib/io/buffered_inputstream.h"
-#include "parquet/api/reader.h"
-
-namespace tensorflow {
-namespace data {
-
-class ParquetRandomAccessFile : public ::arrow::io::RandomAccessFile {
-public:
-  explicit ParquetRandomAccessFile(io::InputStreamInterface* s)
-    : input_stream_(nullptr)
-    , buffered_stream_(nullptr) {
-    input_stream_ = dynamic_cast<SizedRandomAccessInputStreamInterface*>(s);
-    if (input_stream_ == nullptr) {
-      buffered_stream_.reset(new SizedRandomAccessBufferedStream(s));
-      input_stream_ = buffered_stream_.get();
-    }
-  }
-  ~ParquetRandomAccessFile() {}
-  arrow::Status Close() override {
-    return arrow::Status::OK();
-  }
-  arrow::Status Tell(int64_t* position) const override {
-    return arrow::Status::NotImplemented("Tell");
-  }
-  arrow::Status Seek(int64_t position) override {
-    return arrow::Status::NotImplemented("Seek");
-  }
-  arrow::Status Read(int64_t nbytes, int64_t* bytes_read, void* out) override {
-    return arrow::Status::NotImplemented("Read (void*)");
-  }
-  arrow::Status Read(int64_t nbytes, std::shared_ptr<arrow::Buffer>* out) override {
-    return arrow::Status::NotImplemented("Read (Buffer*)");
-  }
-  arrow::Status GetSize(int64_t* size) override {
-    uint64 size_value = 0;
-    Status status = input_stream_->GetFileSize(&size_value);
-    if (!status.ok()) {
-      return arrow::Status::IOError(status.error_message());
-    }
-    *size = size_value;
-    return arrow::Status::OK();
-  }
-  bool supports_zero_copy() const override {
-    return false;
-  }
-  arrow::Status ReadAt(int64_t position, int64_t nbytes, int64_t* bytes_read, void* out) override {
-    StringPiece result;
-    Status status = input_stream_->Read(position, nbytes, &result, (char *)out);
-    if (!(status.ok() || errors::IsOutOfRange(status))) {
-        return arrow::Status::IOError(status.error_message());
-    }
-    *bytes_read = result.size();
-    return arrow::Status::OK();
-  }
-  arrow::Status ReadAt(int64_t position, int64_t nbytes, std::shared_ptr<arrow::Buffer>* out) override {
-    string buffer;
-    buffer.resize(nbytes);
-    StringPiece result;
-    Status status = input_stream_->Read(position, nbytes, &result, &buffer[0]);
-    if (!(status.ok() || errors::IsOutOfRange(status))) {
-        return arrow::Status::IOError(status.error_message());
-    }
-    buffer.resize(result.size());
-    return arrow::Buffer::FromString(buffer, out);
-  }
-private:
-  SizedRandomAccessInputStreamInterface* input_stream_;
-  std::unique_ptr<SizedRandomAccessBufferedStream> buffered_stream_;
-};
-
-class ParquetInputStream{
-public:
-  explicit ParquetInputStream(io::InputStreamInterface* s, const std::vector<string>& columns)
-    : input_stream_(new ParquetRandomAccessFile(s))
-    , column_names_(columns) {
-  }
-  Status ReadHeader() {
-    parquet_reader_ = parquet::ParquetFileReader::Open(input_stream_);
-    file_metadata_ = parquet_reader_->metadata();
-    columns_ = std::vector<int64>(column_names_.size(), -1);
-    dtypes_ = std::vector<DataType>(column_names_.size());
-    for (size_t i = 0; i < column_names_.size(); i++) {
-      for (int j = 0; j < file_metadata_->schema()->num_columns(); j++) {
-        if (column_names_[i] == file_metadata_->schema()->Column(j)->path().get()->ToDotString()) {
-          columns_[i] = j;
-          switch(file_metadata_->schema()->Column(j)->physical_type()) {
-          case parquet::Type::BOOLEAN:
-            dtypes_[i] = DT_BOOL;
-            break;
-          case parquet::Type::INT32:
-            dtypes_[i] = DT_INT32;
-            break;
-          case parquet::Type::INT64:
-            dtypes_[i] = DT_INT64;
-            break;
-          case parquet::Type::FLOAT:
-            dtypes_[i] = DT_FLOAT;
-            break;
-          case parquet::Type::DOUBLE:
-            dtypes_[i] = DT_DOUBLE;
-            break;
-          default:
-            return errors::InvalidArgument("data type is not supported for column ", column_names_[i]);
-          }
-          break;
-        }
-      }
-      if (columns_[i] < 0) {
-        return errors::InvalidArgument("unable to find column ", column_names_[i]);
-      }
-    }
-    current_row_group_ = 0;
-    TF_RETURN_IF_ERROR(ReadRowGroup());
-    return Status::OK();
-  }
-  DataType DType(int64 i) {
-    return dtypes_[i];
-  }
-  int64 Columns() {
-    return (int64)columns_.size();
-  }
-  Status ReadRowGroup() {
-    if (current_row_group_ < file_metadata_->num_row_groups()) {
-      row_group_reader_ = parquet_reader_->RowGroup(current_row_group_);
-      column_readers_.clear();
-      for (size_t i = 0; i < columns_.size(); i++) {
-        int64 column = columns_[i];
-        std::shared_ptr<parquet::ColumnReader> column_reader =
-            row_group_reader_->Column(column);
-        column_readers_.emplace_back(column_reader);
-      }
-    }
-    current_row_ = 0;
-    return Status::OK();
-  }
-  ~ParquetInputStream() {
-    current_row_ = 0;
-    column_readers_.clear();
-    row_group_reader_.reset();
-    current_row_group_ = 0;
-    file_metadata_.reset();
-    parquet_reader_.reset();
-  }
-  Status ReadRecord(int64 index, int64 record_to_read, std::vector<Tensor>* out_tensors, int64* record_read) {
-    while (current_row_group_ < file_metadata_->num_row_groups()) {
-      if (current_row_ < row_group_reader_->metadata()->num_rows()) {
-        // Read columns to outputs.
-        // TODO: Read more than one value at a time.
-        for (size_t i = 0; i < columns_.size(); i++) {
-          DataType dtype = dtypes_[i];
-          std::shared_ptr<parquet::ColumnReader> column_reader = column_readers_[i];
-          TF_RETURN_IF_ERROR(GetTensorValue(current_row_, dtype, column_reader.get(), &(*out_tensors)[i], index));
-        }
-        ++current_row_;
-        *record_read = 1;
-        return Status::OK();
-      }
-      // We have reached the end of the current row group, so maybe
-      // move on to next row group.
-      current_row_ = 0;
-      row_group_reader_.reset();
-      ++current_row_group_;
-      TF_RETURN_IF_ERROR(ReadRowGroup());
-    }
-    return Status::OK();
-  }
-private:
-  template <typename DType>
-  Status FillTensorValue(parquet::ColumnReader* column_reader,
-                         typename DType::c_type* value) {
-    parquet::TypedColumnReader<DType>* reader =
-        static_cast<parquet::TypedColumnReader<DType>*>(column_reader);
-    // Read one value at a time. The number of rows read is returned.
-    // values_read contains the number of non-null rows
-    int64_t values_read = 0;
-    int64_t rows_read = reader->ReadBatch(1, nullptr, nullptr, value, &values_read);
-    // Ensure only one value is read and there are no NULL values in the
-    // rows read
-    if (rows_read != 1) {
-      return errors::Internal("rows_read (", rows_read, ") != 1 or values_read (", values_read, ") != 1");
-    }
-    return Status::OK();
-  }
-  Status GetTensorValue(int64 row, const DataType& data_type, parquet::ColumnReader* column_reader, Tensor* tensor, int64 index) {
-    switch (data_type) {
-      case DT_INT32: {
-        parquet::TypedColumnReader<parquet::Int32Type>* reader =
-            static_cast<parquet::TypedColumnReader<parquet::Int32Type>*>(
-                column_reader);
-        int32_t value;
-        TF_RETURN_IF_ERROR(
-            FillTensorValue<parquet::Int32Type>(reader, &value));
-        tensor->flat<int32>()(index) = value;
-      } break;
-      case DT_INT64: {
-        parquet::TypedColumnReader<parquet::Int64Type>* reader =
-            static_cast<parquet::TypedColumnReader<parquet::Int64Type>*>(
-                column_reader);
-        int64_t value;
-        TF_RETURN_IF_ERROR(
-            FillTensorValue<parquet::Int64Type>(reader, &value));
-        tensor->flat<int64>()(index) = value;
-      } break;
-      case DT_FLOAT: {
-        parquet::TypedColumnReader<parquet::FloatType>* reader =
-            static_cast<parquet::TypedColumnReader<parquet::FloatType>*>(
-                column_reader);
-        float value;
-        TF_RETURN_IF_ERROR(
-            FillTensorValue<parquet::FloatType>(reader, &value));
-        tensor->flat<float>()(index) = value;
-      } break;
-      case DT_DOUBLE: {
-        parquet::TypedColumnReader<parquet::DoubleType>* reader =
-            static_cast<parquet::TypedColumnReader<parquet::DoubleType>*>(
-                column_reader);
-        double value;
-        TF_RETURN_IF_ERROR(
-            FillTensorValue<parquet::DoubleType>(reader, &value));
-        tensor->flat<double>()(index) = value;
-      } break;
-      case DT_BOOL: {
-        parquet::TypedColumnReader<parquet::BooleanType>* reader =
-            static_cast<parquet::TypedColumnReader<parquet::BooleanType>*>(
-                column_reader);
-        bool value;
-        TF_RETURN_IF_ERROR(
-            FillTensorValue<parquet::BooleanType>(reader, &value));
-        tensor->flat<bool>()(index) = value;
-      } break;
-      default:
-        return errors::Unimplemented(
-            DataTypeString(data_type),
-            " is currently not supported in ParquetDataset");
-    }
-    return Status::OK();
-  }
-  std::shared_ptr<::arrow::io::RandomAccessFile> input_stream_;
-  std::vector<string> column_names_;
-  std::vector<int64> columns_;
-  std::vector<DataType> dtypes_;
-  std::unique_ptr<parquet::ParquetFileReader> parquet_reader_;
-  std::shared_ptr<parquet::FileMetaData> file_metadata_;
-  int64 current_row_group_ = 0;
-  std::shared_ptr<parquet::RowGroupReader> row_group_reader_;
-  std::vector<std::shared_ptr<parquet::ColumnReader>> column_readers_;
-  int64 current_row_ = 0;
-};
-
-class ParquetInput: public FileInput<ParquetInputStream> {
- public:
-  Status ReadRecord(io::InputStreamInterface* s, IteratorContext* ctx, std::unique_ptr<ParquetInputStream>& state, int64 record_to_read, int64* record_read, std::vector<Tensor>* out_tensors) const override {
-    if (state.get() == nullptr) {
-      state.reset(new ParquetInputStream(s, columns()));
-      TF_RETURN_IF_ERROR(state.get()->ReadHeader());
-    }
-    // Let's allocate enough space for Tensor, if more than read, replace.
-    for (int64 i = 0; i < state.get()->Columns(); i++) {
-      Tensor tensor(ctx->allocator({}), state.get()->DType(i), {record_to_read});
-      out_tensors->emplace_back(std::move(tensor));
-    }
-    while ((*record_read) < record_to_read) {
-      int64 count = 0;
-      TF_RETURN_IF_ERROR(state.get()->ReadRecord((*record_read), record_to_read - (*record_read), out_tensors, &count));
-      (*record_read) += count;
-      if (count == 0) {
-        break;
-      }
-    }
-    if (*record_read < record_to_read) {
-      if (*record_read == 0) {
-        out_tensors->clear();
-      }
-      for (size_t i = 0; i < out_tensors->size(); i++) {
-        Tensor tensor = (*out_tensors)[i].Slice(0, *record_read);
-        (*out_tensors)[i] = std::move(tensor);
-      }
-    }
-    return Status::OK();
-  }
-  Status FromStream(io::InputStreamInterface* s) override {
-    return Status::OK();
-  }
-  void EncodeAttributes(VariantTensorData* data) const override {
-  }
-  bool DecodeAttributes(const VariantTensorData& data) override {
-    return true;
-  }
- protected:
-};
-
-REGISTER_UNARY_VARIANT_DECODE_FUNCTION(ParquetInput, "tensorflow::data::ParquetInput");
-
-REGISTER_KERNEL_BUILDER(Name("ParquetInput").Device(DEVICE_CPU),
-                        FileInputOp<ParquetInput>);
-REGISTER_KERNEL_BUILDER(Name("ParquetDataset").Device(DEVICE_CPU),
-                        FileInputDatasetOp<ParquetInput, ParquetInputStream>);
-}  // namespace data
-}  // namespace tensorflow
diff --git a/tensorflow_io/parquet/kernels/parquet_kernels.cc b/tensorflow_io/parquet/kernels/parquet_kernels.cc
new file mode 100644
index 000000000..e6caf99a8
--- /dev/null
+++ b/tensorflow_io/parquet/kernels/parquet_kernels.cc
@@ -0,0 +1,276 @@
+/* Copyright 2019 The TensorFlow Authors. All Rights Reserved.
+
+Licensed under the Apache License, Version 2.0 (the "License");
+you may not use this file except in compliance with the License.
+You may obtain a copy of the License at
+
+    http://www.apache.org/licenses/LICENSE-2.0
+
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License.
+==============================================================================*/
+
+#include "tensorflow/core/framework/op_kernel.h"
+#include "tensorflow_io/core/kernels/stream.h"
+#include "parquet/api/reader.h"
+
+namespace tensorflow {
+namespace data {
+namespace {
+
+class ParquetRandomAccessFile : public ::arrow::io::RandomAccessFile {
+public:
+  explicit ParquetRandomAccessFile(tensorflow::RandomAccessFile *file, int64 size)
+    : file_(file)
+    , size_(size) { }
+
+  ~ParquetRandomAccessFile() {}
+  arrow::Status Close() override {
+    return arrow::Status::OK();
+  }
+  arrow::Status Tell(int64_t* position) const override {
+    return arrow::Status::NotImplemented("Tell");
+  }
+  arrow::Status Seek(int64_t position) override {
+    return arrow::Status::NotImplemented("Seek");
+  }
+  arrow::Status Read(int64_t nbytes, int64_t* bytes_read, void* out) override {
+    return arrow::Status::NotImplemented("Read (void*)");
+  }
+  arrow::Status Read(int64_t nbytes, std::shared_ptr<arrow::Buffer>* out) override {
+    return arrow::Status::NotImplemented("Read (Buffer*)");
+  }
+  arrow::Status GetSize(int64_t* size) override {
+    *size = size_;
+    return arrow::Status::OK();
+  }
+  bool supports_zero_copy() const override {
+    return false;
+  }
+  arrow::Status ReadAt(int64_t position, int64_t nbytes, int64_t* bytes_read, void* out) override {
+    StringPiece result;
+    Status status = file_->Read(position, nbytes, &result, (char*)out);
+    if (!(status.ok() || errors::IsOutOfRange(status))) {
+        return arrow::Status::IOError(status.error_message());
+    }
+    *bytes_read = result.size();
+    return arrow::Status::OK();
+  }
+  arrow::Status ReadAt(int64_t position, int64_t nbytes, std::shared_ptr<arrow::Buffer>* out) override {
+    string buffer;
+    buffer.resize(nbytes);
+    StringPiece result;
+    Status status = file_->Read(position, nbytes, &result, (char*)(&buffer[0]));
+    if (!(status.ok() || errors::IsOutOfRange(status))) {
+        return arrow::Status::IOError(status.error_message());
+    }
+    buffer.resize(result.size());
+    return arrow::Buffer::FromString(buffer, out);
+  }
+private:
+  tensorflow::RandomAccessFile* file_;
+  int64 size_;
+};
+
+class ListParquetColumnsOp : public OpKernel {
+ public:
+  explicit ListParquetColumnsOp(OpKernelConstruction* context) : OpKernel(context) {
+    env_ = context->env();
+  }
+
+  void Compute(OpKernelContext* context) override {
+    const Tensor& filename_tensor = context->input(0);
+    const string filename = filename_tensor.scalar<string>()();
+
+    const Tensor& memory_tensor = context->input(1);
+    const string& memory = memory_tensor.scalar<string>()();
+
+    std::unique_ptr<SizedRandomAccessFile> file(new SizedRandomAccessFile(env_, filename, memory.data(), memory.size()));
+    uint64 size;
+    OP_REQUIRES_OK(context, file->GetFileSize(&size));
+
+    std::shared_ptr<ParquetRandomAccessFile> parquet_file(new ParquetRandomAccessFile(file.get(), size));
+    std::shared_ptr<::parquet::FileMetaData> metadata = ::parquet::ReadMetaData(parquet_file);
+
+    std::vector<string> columns;
+    std::vector<string> dtypes;
+    std::vector<int64> counts;
+    columns.reserve(metadata->num_columns());
+    dtypes.reserve(metadata->num_columns());
+    counts.reserve(metadata->num_columns());
+    for (int i = 0; i < metadata->num_columns(); i++) {
+      string dtype = "";
+      switch(metadata->schema()->Column(i)->physical_type()) {
+      case parquet::Type::BOOLEAN:
+        dtype = "bool";
+        break;
+      case parquet::Type::INT32:
+        dtype = "int32";
+        break;
+      case parquet::Type::INT64:
+        dtype = "int64";
+        break;
+      case parquet::Type::FLOAT:
+        dtype = "float";
+        break;
+      case parquet::Type::DOUBLE:
+        dtype = "double";
+        break;
+      default:
+        // Unsupported data type INT96, BYTE_ARRAY, FIXED_LEN_BYTE_ARRAY
+        break;
+      }
+      if (dtype == "") {
+        continue;
+      }
+      columns.push_back(metadata->schema()->Column(i)->path().get()->ToDotString());
+      dtypes.push_back(dtype);
+      counts.push_back(metadata->num_rows());
+    }
+
+    TensorShape output_shape = filename_tensor.shape();
+    output_shape.AddDim(columns.size());
+
+    Tensor* columns_tensor;
+    OP_REQUIRES_OK(context, context->allocate_output(0, output_shape, &columns_tensor));
+    Tensor* dtypes_tensor;
+    OP_REQUIRES_OK(context, context->allocate_output(1, output_shape, &dtypes_tensor));
+
+    output_shape.AddDim(1);
+
+    Tensor* shapes_tensor;
+    OP_REQUIRES_OK(context, context->allocate_output(2, output_shape, &shapes_tensor));
+
+    for (int i = 0; i < columns.size(); i++) {
+      columns_tensor->flat<string>()(i) = columns[i];
+      dtypes_tensor->flat<string>()(i) = dtypes[i];
+      shapes_tensor->flat<int64>()(i) = counts[i];
+    }
+  }
+ private:
+  mutex mu_;
+  Env* env_ GUARDED_BY(mu_);
+};
+
+class ReadParquetOp : public OpKernel {
+ public:
+  explicit ReadParquetOp(OpKernelConstruction* context) : OpKernel(context) {
+    env_ = context->env();
+  }
+
+  void Compute(OpKernelContext* context) override {
+    const Tensor& filename_tensor = context->input(0);
+    const string& filename = filename_tensor.scalar<string>()();
+
+    const Tensor& column_tensor = context->input(1);
+    const string& column = column_tensor.scalar<string>()();
+
+    const Tensor& memory_tensor = context->input(2);
+    const string& memory = memory_tensor.scalar<string>()();
+
+    const Tensor& start_tensor = context->input(3);
+    int64 start = start_tensor.scalar<int64>()();
+
+    const Tensor& stop_tensor = context->input(4);
+    int64 stop = stop_tensor.scalar<int64>()();
+
+    std::unique_ptr<SizedRandomAccessFile> file(new SizedRandomAccessFile(env_, filename, memory.data(), memory.size()));
+    uint64 size;
+    OP_REQUIRES_OK(context, file->GetFileSize(&size));
+
+    std::shared_ptr<ParquetRandomAccessFile> parquet_file(new ParquetRandomAccessFile(file.get(), size));
+    std::unique_ptr<::parquet::ParquetFileReader> parquet_reader = parquet::ParquetFileReader::Open(parquet_file);
+    std::shared_ptr<::parquet::FileMetaData> file_metadata = parquet_reader->metadata();
+    int column_index = 0;
+    while (column_index < file_metadata->num_columns()) {
+      if (file_metadata->schema()->Column(column_index)->path().get()->ToDotString() == column) {
+        break;
+      }
+      column_index++;
+    }
+    OP_REQUIRES(context, (column_index < file_metadata->num_columns()), errors::InvalidArgument("unable to find column: ", column));
+
+    if (start > file_metadata->num_rows()) {
+      start = file_metadata->num_rows();
+    }
+    if (stop < 0) {
+        stop = file_metadata->num_rows();
+    }
+    if (stop > file_metadata->num_rows()) {
+        stop = file_metadata->num_rows();
+    }
+
+    TensorShape output_shape({stop - start});
+
+    Tensor* output_tensor;
+    OP_REQUIRES_OK(context, context->allocate_output(0, output_shape, &output_tensor));
+
+    int64 row_group_offset = 0;
+    for (int row_group = 0; row_group < file_metadata->num_row_groups(); row_group++) {
+      std::shared_ptr<parquet::RowGroupReader> row_group_reader = parquet_reader->RowGroup(row_group);
+      // Skip if row group is not within [start..stop]
+      if ((row_group_offset + row_group_reader->metadata()->num_rows() < start) || (stop <= row_group_offset)) {
+        row_group_offset += row_group_reader->metadata()->num_rows();
+        continue;
+      }
+      // Find row_to_read range
+      int64 row_to_read_start = row_group_offset > start ? row_group_offset : start;
+      int64 row_to_read_final = (row_group_offset + row_group_reader->metadata()->num_rows()) < (stop) ? (row_group_offset + row_group_reader->metadata()->num_rows()) : (stop);
+      int64 row_to_read_count = row_to_read_final - row_to_read_start;
+
+      std::shared_ptr<parquet::ColumnReader> column_reader = row_group_reader->Column(column_index);
+
+      // buffer to fill location is tensor.data()[row_to_read_start - start]
+
+      #define PROCESS_TYPE(ptype, type) \
+        { \
+          parquet::TypedColumnReader<ptype>* reader = \
+              static_cast<parquet::TypedColumnReader<ptype>*>( \
+                  column_reader.get()); \
+          if (row_to_read_start > row_group_offset) { \
+            reader->Skip(row_to_read_start - row_group_offset); \
+          } \
+          ptype::c_type* value = (ptype::c_type *)(void *)(&(output_tensor->flat<type>().data()[row_to_read_start - start])); \
+          int64_t values_read; \
+          int64_t levels_read = reader->ReadBatch(row_to_read_count, nullptr, nullptr, value, &values_read); \
+          OP_REQUIRES(context, (levels_read == values_read && levels_read == row_to_read_count), errors::InvalidArgument("null value in column: ", column)); \
+        }
+      switch (file_metadata->schema()->Column(column_index)->physical_type()) {
+      case parquet::Type::BOOLEAN:
+        PROCESS_TYPE(parquet::BooleanType, bool);
+        break;
+      case parquet::Type::INT32:
+        PROCESS_TYPE(parquet::Int32Type, int32);
+        break;
+      case parquet::Type::INT64:
+        PROCESS_TYPE(parquet::Int64Type, int64);
+        break;
+      case parquet::Type::FLOAT:
+        PROCESS_TYPE(parquet::FloatType, float);
+        break;
+      case parquet::Type::DOUBLE:
+        PROCESS_TYPE(parquet::DoubleType, double);
+        break;
+      default:
+        OP_REQUIRES(context, false, errors::InvalidArgument("invalid data type: ", file_metadata->schema()->Column(column_index)->physical_type()));
+      }
+      row_group_offset += row_group_reader->metadata()->num_rows();
+    }
+  }
+ private:
+  mutex mu_;
+  Env* env_ GUARDED_BY(mu_);
+};
+
+REGISTER_KERNEL_BUILDER(Name("ListParquetColumns").Device(DEVICE_CPU),
+                        ListParquetColumnsOp);
+REGISTER_KERNEL_BUILDER(Name("ReadParquet").Device(DEVICE_CPU),
+                        ReadParquetOp);
+
+
+}  // namespace
+}  // namespace data
+}  // namespace tensorflow
diff --git a/tensorflow_io/parquet/ops/parquet_ops.cc b/tensorflow_io/parquet/ops/parquet_ops.cc
index e38adb8f1..32c318f8c 100644
--- a/tensorflow_io/parquet/ops/parquet_ops.cc
+++ b/tensorflow_io/parquet/ops/parquet_ops.cc
@@ -19,27 +19,29 @@ limitations under the License.
 
 namespace tensorflow {
 
-REGISTER_OP("ParquetInput")
-    .Input("source: string")
-    .Output("handle: variant")
-    .Attr("filters: list(string) = []")
-    .Attr("columns: list(string) = []")
-    .Attr("schema: string = ''")
+REGISTER_OP("ListParquetColumns")
+    .Input("filename: string")
+    .Input("memory: string")
+    .Output("columns: string")
+    .Output("dtypes: string")
+    .Output("shapes: int64")
     .SetShapeFn([](shape_inference::InferenceContext* c) {
        c->set_output(0, c->MakeShape({c->UnknownDim()}));
+       c->set_output(1, c->MakeShape({c->UnknownDim()}));
+       c->set_output(2, c->MakeShape({c->UnknownDim(), c->UnknownDim()}));
        return Status::OK();
      });
 
-REGISTER_OP("ParquetDataset")
-    .Input("input: T")
-    .Input("batch: int64")
-    .Output("handle: variant")
-    .Attr("output_types: list(type) >= 1")
-    .Attr("output_shapes: list(shape) >= 1")
-    .Attr("T: {string, variant} = DT_VARIANT")
-    .SetIsStateful()
+REGISTER_OP("ReadParquet")
+    .Input("filename: string")
+    .Input("column: string")
+    .Input("memory: string")
+    .Input("start: int64")
+    .Input("stop: int64")
+    .Attr("dtype: type")
+    .Output("output: dtype")
     .SetShapeFn([](shape_inference::InferenceContext* c) {
-       c->set_output(0, c->MakeShape({}));
+       c->set_output(0, c->MakeShape({c->UnknownDim()}));
        return Status::OK();
      });
 
diff --git a/tensorflow_io/parquet/python/ops/parquet_ops.py b/tensorflow_io/parquet/python/ops/parquet_ops.py
index 2f1e575ad..a0cb9407a 100644
--- a/tensorflow_io/parquet/python/ops/parquet_ops.py
+++ b/tensorflow_io/parquet/python/ops/parquet_ops.py
@@ -18,68 +18,68 @@
 from __future__ import print_function
 
 import tensorflow as tf
-from tensorflow.compat.v1 import data
-from tensorflow_io import _load_library
-parquet_ops = _load_library('_parquet_ops.so')
+from tensorflow_io.core.python.ops import core_ops as parquet_ops
+from tensorflow_io.core.python.ops import data_ops
 
-class ParquetDataset(data.Dataset):
+def list_parquet_columns(filename, **kwargs):
+  """list_parquet_columns"""
+  if not tf.executing_eagerly():
+    raise NotImplementedError("list_parquet_columns only support eager mode")
+  memory = kwargs.get("memory", "")
+  columns, dtypes, shapes = parquet_ops.list_parquet_columns(
+      filename, memory=memory)
+  entries = zip(tf.unstack(columns), tf.unstack(dtypes), tf.unstack(shapes))
+  return dict([(column.numpy().decode(), tf.TensorSpec(
+      shape.numpy(), dtype.numpy().decode(), column.numpy().decode())) for (
+          column, dtype, shape) in entries])
+
+def read_parquet(filename, column, **kwargs):
+  """read_parquet"""
+  memory = kwargs.get("memory", "")
+  start = kwargs.get("start", 0)
+  stop = kwargs.get("stop", None)
+  if stop is None and column.shape[0] is not None:
+    stop = column.shape[0] - start
+  if stop is None:
+    stop = -1
+  return parquet_ops.read_parquet(
+      filename, column.name, memory=memory,
+      start=start, stop=-1, dtype=column.dtype)
+
+class ParquetDataset(data_ops.BaseDataset):
   """A Parquet Dataset that reads the parquet file."""
 
-  def __init__(self, filename, columns, dtypes=None, batch=None):
+  def __init__(self, filename, column, **kwargs):
     """Create a `ParquetDataset`.
 
     `ParquetDataset` allows a user to read data from a parquet file.
-    For example:
-
-    ```python
-    dataset = tf.contrib.parquet.ParquetDataset(
-        "/foo/bar.parquet", [0, 1], (tf.bool, tf.int32))
-    iterator = dataset.make_one_shot_iterator()
-    next_element = iterator.get_next()
-    # Prints the rows of the result set of the column [0, 1].
-    while True:
-      try:
-        print(sess.run(next_element))
-      except tf.errors.OutOfRangeError:
-        break
-    ```
 
     Args:
-      filename: A 0-D or 1-D `tf.string` tensor containing one or more
-        filenames.
-      columns: A 0-D or 1-D `tf.int32` tensor containing the columns to extract.
-      dtypes: A tuple of `tf.DType` objects representing the types of the
-        columns returned.
+      filename: filename of the parquet file to read.
+      column: column name to read.
     """
-    self._data_input = parquet_ops.parquet_input(
-        filename, ["none", "gz"], columns=columns)
-    self._columns = columns
-    self._dtypes = dtypes
-    self._batch = 0 if batch is None else batch
-    super(ParquetDataset, self).__init__()
-
-  def _inputs(self):
-    return []
-
-  def _as_variant_tensor(self):
-    return parquet_ops.parquet_dataset(
-        self._data_input,
-        self._batch,
-        output_types=self.output_types,
-        output_shapes=self.output_shapes)
+    # Note: start, stop and dtype could be in kwargs if in graph mode.
+    if not tf.executing_eagerly():
+      start = kwargs.get("start")
+      stop = kwargs.get("stop")
+      dtype = kwargs.get("dtype")
+    else:
+      columns = list_parquet_columns(filename)
+      start = 0
+      stop = columns[column].shape[0]
+      dtype = columns[column].dtype
 
-  @property
-  def output_classes(self):
-    return tuple([tf.Tensor for _ in self._columns])
+    shape = tf.TensorShape([None])
 
-  @property
-  def output_shapes(self):
-    return tuple(
-        [tf.TensorShape([]) for _ in self._columns]
-    ) if self._batch is None else tuple(
-        [tf.TensorShape([None]) for _ in self._columns]
-    )
+    # capacity is the rough count for each chunk in dataset
+    capacity = kwargs.get("capacity", 65536)
+    entry_start = list(range(start, stop, capacity))
+    entry_stop = entry_start[1:] + [stop]
+    dataset = data_ops.BaseDataset.from_tensor_slices(
+        (tf.constant(entry_start, tf.int64), tf.constant(entry_stop, tf.int64))
+    ).map(lambda start, stop: parquet_ops.read_parquet(
+        filename, column, memory="", start=start, stop=stop, dtype=dtype))
+    self._dataset = dataset
 
-  @property
-  def output_types(self):
-    return self._dtypes
+    super(ParquetDataset, self).__init__(
+        self._dataset._variant_tensor, [dtype], [shape]) # pylint: disable=protected-access
diff --git a/tests/test_parquet.py b/tests/test_parquet.py
index 20af0ff20..e66d67461 100644
--- a/tests/test_parquet.py
+++ b/tests/test_parquet.py
@@ -19,137 +19,71 @@
 from __future__ import print_function
 
 import os
+import pytest
+import numpy as np
 
 import tensorflow as tf
 tf.compat.v1.disable_eager_execution()
-
-from tensorflow import dtypes  # pylint: disable=wrong-import-position
-from tensorflow import errors  # pylint: disable=wrong-import-position
-from tensorflow import test    # pylint: disable=wrong-import-position
-from tensorflow.compat.v1 import data # pylint: disable=wrong-import-position
-
 import tensorflow_io.parquet as parquet_io # pylint: disable=wrong-import-position
 
-class ParquetDatasetTest(test.TestCase):
-  """ParquetDatasetTest"""
-  def test_parquet_dataset(self):
-    """Test case for ParquetDataset.
-
-    Note: The sample file is generated from:
-    `parquet-cpp/examples/low-level-api/reader_writer`
-    This test extracts columns of [0, 1, 2, 4, 5]
-    with column data types of [bool, int32, int64, float, double].
-    Please check `parquet-cpp/examples/low-level-api/reader-writer.cc`
-    to find details of how records are generated:
-    Column 0 (bool): True for even rows and False otherwise.
-    Column 1 (int32): Equal to row_index.
-    Column 2 (int64): Equal to row_index * 1000 * 1000 * 1000 * 1000.
-    Column 4 (float): Equal to row_index * 1.1.
-    Column 5 (double): Equal to row_index * 1.1111111.
-    """
-    filename = os.path.join(
-        os.path.dirname(os.path.abspath(__file__)),
-        "test_parquet",
-        "parquet_cpp_example.parquet")
-    filename = "file://" + filename
-    columns = [
-        'boolean_field',
-        'int32_field',
-        'int64_field',
-        'float_field',
-        'double_field']
-    output_types = (
-        dtypes.bool, dtypes.int32, dtypes.int64, dtypes.float32, dtypes.float64)
-    num_repeats = 2
-
-    dataset = parquet_io.ParquetDataset(
-        [filename], columns, output_types).repeat(num_repeats)
-    iterator = data.make_initializable_iterator(dataset)
-    init_op = iterator.initializer
-    get_next = iterator.get_next()
+# Note: The sample file is generated from:
+# `parquet-cpp/examples/low-level-api/reader_writer`
+# This test extracts columns of [0, 1, 2, 4, 5]
+# with column data types of [bool, int32, int64, float, double].
+# Please check `parquet-cpp/examples/low-level-api/reader-writer.cc`
+# to find details of how records are generated:
+# Column 0 (bool): True for even rows and False otherwise.
+# Column 1 (int32): Equal to row_index.
+# Column 2 (int64): Equal to row_index * 1000 * 1000 * 1000 * 1000.
+# Column 4 (float): Equal to row_index * 1.1.
+# Column 5 (double): Equal to row_index * 1.1111111.
+def test_parquet():
+  """Test case for ParquetDataset."""
+  filename = os.path.join(
+      os.path.dirname(os.path.abspath(__file__)),
+      "test_parquet",
+      "parquet_cpp_example.parquet")
+  filename = "file://" + filename
 
-    with self.test_session() as sess:
-      sess.run(init_op)
-      for _ in range(num_repeats):  # Dataset is repeated.
-        for i in range(500): # 500 rows.
-          v0 = ((i % 2) == 0)
-          v1 = i
-          v2 = i * 1000 * 1000 * 1000 * 1000
-          v4 = 1.1 * i
-          v5 = 1.1111111 * i
-          vv = sess.run(get_next)
-          self.assertAllClose((v0, v1, v2, v4, v5), vv)
-      with self.assertRaises(errors.OutOfRangeError):
-        sess.run(get_next)
+  columns = [
+      'boolean_field',
+      'int32_field',
+      'int64_field',
+      'float_field',
+      'double_field']
+  dtypes = [
+      tf.bool,
+      tf.int32,
+      tf.int64,
+      tf.float32,
+      tf.double]
 
-    dataset = parquet_io.ParquetDataset(
-        [filename], columns, output_types, batch=1)
-    iterator = data.make_initializable_iterator(dataset)
-    init_op = iterator.initializer
-    get_next = iterator.get_next()
+  dataset = tf.compat.v2.data.Dataset.zip(
+      tuple([parquet_io.ParquetDataset(
+          filename, column, dtype=dtype,
+          start=0, stop=500) for (
+              column, dtype) in zip(columns, dtypes)])).apply(
+                  tf.data.experimental.unbatch())
 
-    with self.test_session() as sess:
-      sess.run(init_op)
-      for i in range(500):
-        v0 = ((i % 2) == 0)
-        v1 = i
-        v2 = i * 1000 * 1000 * 1000 * 1000
-        v4 = 1.1 * i
-        v5 = 1.1111111 * i
-        vv = sess.run(get_next)
-        self.assertAllClose(([v0], [v1], [v2], [v4], [v5]), vv)
-      with self.assertRaises(errors.OutOfRangeError):
-        sess.run(get_next)
-
-    dataset = parquet_io.ParquetDataset(
-        [filename, filename], columns, output_types, batch=3)
-    iterator = data.make_initializable_iterator(dataset)
-    init_op = iterator.initializer
-    get_next = iterator.get_next()
-
-    with self.test_session() as sess:
-      sess.run(init_op)
-      for ii in range(0, 999, 3):
-        v0, v1, v2, v4, v5 = [], [], [], [], []
-        for i in [ii % 500, (ii + 1) % 500, (ii + 2) % 500]:
-          v0.append((i % 2) == 0)
-          v1.append(i)
-          v2.append(i * 1000 * 1000 * 1000 * 1000)
-          v4.append(1.1 * i)
-          v5.append(1.1111111 * i)
-        vv = sess.run(get_next)
-        self.assertAllClose((v0, v1, v2, v4, v5), vv)
-      i = 999 % 500
+  iterator = tf.compat.v1.data.make_initializable_iterator(dataset)
+  init_op = iterator.initializer
+  get_next = iterator.get_next()
+  with tf.compat.v1.Session() as sess:
+    sess.run(init_op)
+    for i in range(500):
       v0 = ((i % 2) == 0)
       v1 = i
       v2 = i * 1000 * 1000 * 1000 * 1000
       v4 = 1.1 * i
       v5 = 1.1111111 * i
-      vv = sess.run(get_next)
-      self.assertAllClose(([v0], [v1], [v2], [v4], [v5]), vv)
-      with self.assertRaises(errors.OutOfRangeError):
-        sess.run(get_next)
-
-    # With compression
-    filename = filename + '.gz'
-    dataset = parquet_io.ParquetDataset(
-        [filename], columns, output_types).repeat(num_repeats)
-    iterator = data.make_initializable_iterator(dataset)
-    init_op = iterator.initializer
-    get_next = iterator.get_next()
+      p0, p1, p2, p4, p5 = sess.run(get_next)
+      assert v0 == p0
+      assert v1 == p1
+      assert v2 == p2
+      assert np.isclose(v4, p4)
+      assert np.isclose(v5, p5)
+    with pytest.raises(tf.errors.OutOfRangeError):
+      sess.run(get_next)
 
-    with self.test_session() as sess:
-      sess.run(init_op)
-      for _ in range(num_repeats):  # Dataset is repeated.
-        for i in range(500): # 500 rows.
-          v0 = ((i % 2) == 0)
-          v1 = i
-          v2 = i * 1000 * 1000 * 1000 * 1000
-          v4 = 1.1 * i
-          v5 = 1.1111111 * i
-          vv = sess.run(get_next)
-          self.assertAllClose((v0, v1, v2, v4, v5), vv)
-      with self.assertRaises(errors.OutOfRangeError):
-        sess.run(get_next)
 if __name__ == "__main__":
   test.main()
diff --git a/tests/test_parquet_eager.py b/tests/test_parquet_eager.py
new file mode 100644
index 000000000..d80440a20
--- /dev/null
+++ b/tests/test_parquet_eager.py
@@ -0,0 +1,95 @@
+# Copyright 2018 The TensorFlow Authors. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License"); you may not
+# use this file except in compliance with the License.  You may obtain a copy of
+# the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
+# WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.  See the
+# License for the specific language governing permissions and limitations under
+# the License.
+# ==============================================================================
+"""Tests for read_parquet and ParquetDataset."""
+
+from __future__ import absolute_import
+from __future__ import division
+from __future__ import print_function
+
+import os
+import numpy as np
+
+import tensorflow as tf
+if not (hasattr(tf, "version") and tf.version.VERSION.startswith("2.")):
+  tf.compat.v1.enable_eager_execution()
+import tensorflow_io.parquet as parquet_io # pylint: disable=wrong-import-position
+
+# Note: The sample file is generated from:
+# `parquet-cpp/examples/low-level-api/reader_writer`
+# This test extracts columns of [0, 1, 2, 4, 5]
+# with column data types of [bool, int32, int64, float, double].
+# Please check `parquet-cpp/examples/low-level-api/reader-writer.cc`
+# to find details of how records are generated:
+# Column 0 (bool): True for even rows and False otherwise.
+# Column 1 (int32): Equal to row_index.
+# Column 2 (int64): Equal to row_index * 1000 * 1000 * 1000 * 1000.
+# Column 4 (float): Equal to row_index * 1.1.
+# Column 5 (double): Equal to row_index * 1.1111111.
+def test_parquet():
+  """Test case for read_parquet.
+
+  """
+  filename = os.path.join(
+      os.path.dirname(os.path.abspath(__file__)),
+      "test_parquet",
+      "parquet_cpp_example.parquet")
+  filename = "file://" + filename
+
+  specs = parquet_io.list_parquet_columns(filename)
+  columns = [
+      'boolean_field',
+      'int32_field',
+      'int64_field',
+      'float_field',
+      'double_field']
+  p0 = parquet_io.read_parquet(filename, specs['boolean_field'])
+  p1 = parquet_io.read_parquet(filename, specs['int32_field'])
+  p2 = parquet_io.read_parquet(filename, specs['int64_field'])
+  p4 = parquet_io.read_parquet(filename, specs['float_field'])
+  p5 = parquet_io.read_parquet(filename, specs['double_field'])
+
+  for i in range(500): # 500 rows.
+    v0 = ((i % 2) == 0)
+    v1 = i
+    v2 = i * 1000 * 1000 * 1000 * 1000
+    v4 = 1.1 * i
+    v5 = 1.1111111 * i
+    assert v0 == p0[i].numpy()
+    assert v1 == p1[i].numpy()
+    assert v2 == p2[i].numpy()
+    assert np.isclose(v4, p4[i].numpy())
+    assert np.isclose(v5, p5[i].numpy())
+
+  dataset = tf.compat.v2.data.Dataset.zip(
+      tuple(
+          [parquet_io.ParquetDataset(filename, column) for column in columns])
+  ).apply(tf.data.experimental.unbatch())
+  i = 0
+  for p in dataset:
+    v0 = ((i % 2) == 0)
+    v1 = i
+    v2 = i * 1000 * 1000 * 1000 * 1000
+    v4 = 1.1 * i
+    v5 = 1.1111111 * i
+    p0, p1, p2, p4, p5 = p
+    assert v0 == p0.numpy()
+    assert v1 == p1.numpy()
+    assert v2 == p2.numpy()
+    assert np.isclose(v4, p4.numpy())
+    assert np.isclose(v5, p5.numpy())
+    i += 1
+
+if __name__ == "__main__":
+  test.main()