The problem with memory leak in MPI data transfer fixed and tested.
This commit is contained in:
parent
b5a81bc0fc
commit
6f48eca95b
|
@ -85,7 +85,7 @@ bool pFlow::processorBoundaryContactSearch::broadSearch
|
||||||
{
|
{
|
||||||
if(masterSearch_)
|
if(masterSearch_)
|
||||||
{
|
{
|
||||||
/*const auto thisPoints = boundary().thisPoints();
|
const auto thisPoints = boundary().thisPoints();
|
||||||
const auto& neighborProcPoints = boundary().neighborProcPoints();
|
const auto& neighborProcPoints = boundary().neighborProcPoints();
|
||||||
const auto& bDiams = diameter_.BoundaryField(thisBoundaryIndex());
|
const auto& bDiams = diameter_.BoundaryField(thisBoundaryIndex());
|
||||||
const auto thisDiams = bDiams.thisField();
|
const auto thisDiams = bDiams.thisField();
|
||||||
|
@ -96,9 +96,9 @@ bool pFlow::processorBoundaryContactSearch::broadSearch
|
||||||
thisPoints,
|
thisPoints,
|
||||||
thisDiams,
|
thisDiams,
|
||||||
neighborProcPoints,
|
neighborProcPoints,
|
||||||
neighborProcDiams);
|
neighborProcDiams
|
||||||
|
);
|
||||||
pOutput<<"ppPairs size in boundary"<< ppPairs.size()<<endl; */
|
//pOutput<<"ppSize "<< ppPairs.size()<<endl;
|
||||||
return true;
|
return true;
|
||||||
|
|
||||||
}else
|
}else
|
||||||
|
|
|
@ -99,7 +99,7 @@ bool pFlow::twoPartContactSearch::broadSearchPP
|
||||||
ppPairs.increaseCapacityBy(len);
|
ppPairs.increaseCapacityBy(len);
|
||||||
|
|
||||||
INFORMATION<< "Particle-particle contact pair container capacity increased from "<<
|
INFORMATION<< "Particle-particle contact pair container capacity increased from "<<
|
||||||
oldCap << " to "<<ppPairs.capacity()<<" in peiodicBoundaryContactSearch."<<END_INFO;
|
oldCap << " to "<<ppPairs.capacity()<<" in contact search in boundary region."<<END_INFO;
|
||||||
|
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
|
@ -47,9 +47,8 @@ bool pFlow::MPI::processorBoundarySphereInteraction<cFM, gMM>::sphereSphereInter
|
||||||
|
|
||||||
const auto & sphPar = this->sphParticles();
|
const auto & sphPar = this->sphParticles();
|
||||||
uint32 thisIndex = this->boundary().thisBoundaryIndex();
|
uint32 thisIndex = this->boundary().thisBoundaryIndex();
|
||||||
const auto& a = sphPar.diameter().BoundaryField(thisIndex).neighborProcField().deviceViewAll();
|
pOutput<<"beofre sphereSphereInteraction"<<endl;
|
||||||
|
pFlow::MPI::processorBoundarySIKernels::sphereSphereInteraction(
|
||||||
/*pFlow::MPI::processorBoundarySIKernels::sphereSphereInteraction(
|
|
||||||
dt,
|
dt,
|
||||||
this->ppPairs(),
|
this->ppPairs(),
|
||||||
cfModel,
|
cfModel,
|
||||||
|
@ -67,7 +66,9 @@ bool pFlow::MPI::processorBoundarySphereInteraction<cFM, gMM>::sphereSphereInter
|
||||||
sphPar.rVelocity().BoundaryField(thisIndex).neighborProcField().deviceViewAll(),
|
sphPar.rVelocity().BoundaryField(thisIndex).neighborProcField().deviceViewAll(),
|
||||||
sphPar.contactForce().BoundaryField(thisIndex).neighborProcField().deviceViewAll(),
|
sphPar.contactForce().BoundaryField(thisIndex).neighborProcField().deviceViewAll(),
|
||||||
sphPar.contactTorque().BoundaryField(thisIndex).neighborProcField().deviceViewAll()
|
sphPar.contactTorque().BoundaryField(thisIndex).neighborProcField().deviceViewAll()
|
||||||
);*/
|
);
|
||||||
|
|
||||||
|
pOutput<<"after sphereSphereInteraction"<<endl;
|
||||||
|
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
|
@ -24,13 +24,13 @@ pFlow::MPI::processorBoundaryField<T, MemorySpace>::checkDataRecieved() const
|
||||||
{
|
{
|
||||||
if (!dataRecieved_)
|
if (!dataRecieved_)
|
||||||
{
|
{
|
||||||
//uint32 nRecv = reciever_.waitComplete();
|
uint32 nRecv = reciever_.waitBufferForUse();
|
||||||
dataRecieved_ = true;
|
dataRecieved_ = true;
|
||||||
/*if (nRecv != this->neighborProcSize())
|
if (nRecv != this->neighborProcSize())
|
||||||
{
|
{
|
||||||
fatalErrorInFunction;
|
fatalErrorInFunction;
|
||||||
fatalExit;
|
fatalExit;
|
||||||
}*/
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@ -41,7 +41,7 @@ pFlow::MPI::processorBoundaryField<T, MemorySpace>::updateBoundary(
|
||||||
DataDirection direction
|
DataDirection direction
|
||||||
)
|
)
|
||||||
{
|
{
|
||||||
/*if (step == 1)
|
if (step == 1)
|
||||||
{
|
{
|
||||||
// Isend
|
// Isend
|
||||||
if (direction == DataDirection::TwoWay ||
|
if (direction == DataDirection::TwoWay ||
|
||||||
|
@ -67,7 +67,7 @@ pFlow::MPI::processorBoundaryField<T, MemorySpace>::updateBoundary(
|
||||||
{
|
{
|
||||||
fatalErrorInFunction << "Invalid step number " << step << endl;
|
fatalErrorInFunction << "Invalid step number " << step << endl;
|
||||||
return false;
|
return false;
|
||||||
}*/
|
}
|
||||||
|
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
|
|
|
@ -50,11 +50,11 @@ public:
|
||||||
|
|
||||||
private:
|
private:
|
||||||
|
|
||||||
dataSender<T, MemorySpace> sender_;
|
dataSender<T, MemorySpace> sender_;
|
||||||
|
|
||||||
mutable dataReciever<T, MemorySpace> reciever_;
|
dataReciever<T, MemorySpace> reciever_;
|
||||||
|
|
||||||
mutable bool dataRecieved_ = true;
|
mutable bool dataRecieved_ = true;
|
||||||
|
|
||||||
void checkDataRecieved()const;
|
void checkDataRecieved()const;
|
||||||
|
|
||||||
|
@ -82,7 +82,6 @@ public:
|
||||||
|
|
||||||
ProcVectorType& neighborProcField() override;
|
ProcVectorType& neighborProcField() override;
|
||||||
|
|
||||||
|
|
||||||
const ProcVectorType& neighborProcField()const override;
|
const ProcVectorType& neighborProcField()const override;
|
||||||
|
|
||||||
bool hearChanges
|
bool hearChanges
|
||||||
|
|
|
@ -25,11 +25,7 @@ Licence:
|
||||||
void
|
void
|
||||||
pFlow::MPI::boundaryProcessor::checkSize() const
|
pFlow::MPI::boundaryProcessor::checkSize() const
|
||||||
{
|
{
|
||||||
if (!sizeObtained_)
|
|
||||||
{
|
|
||||||
//MPI_Wait(&sizeRequest_, StatusIgnore);
|
|
||||||
sizeObtained_ = true;
|
|
||||||
}
|
|
||||||
}
|
}
|
||||||
|
|
||||||
void
|
void
|
||||||
|
@ -37,13 +33,13 @@ pFlow::MPI::boundaryProcessor::checkDataRecieved() const
|
||||||
{
|
{
|
||||||
if (!dataRecieved_)
|
if (!dataRecieved_)
|
||||||
{
|
{
|
||||||
//uint32 nRecv = reciever_.waitComplete();
|
uint32 nRecv = reciever_.waitBufferForUse();
|
||||||
dataRecieved_ = true;
|
dataRecieved_ = true;
|
||||||
/*if (nRecv != neighborProcSize())
|
if (nRecv != neighborProcSize())
|
||||||
{
|
{
|
||||||
fatalErrorInFunction;
|
fatalErrorInFunction;
|
||||||
fatalExit;
|
fatalExit;
|
||||||
}*/
|
}
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@ -92,8 +88,7 @@ pFlow::MPI::boundaryProcessor::beforeIteration(uint32 iterNum, real t, real dt)
|
||||||
pFlowProcessors().localCommunicator(),
|
pFlowProcessors().localCommunicator(),
|
||||||
MPI_STATUS_IGNORE
|
MPI_STATUS_IGNORE
|
||||||
);
|
);
|
||||||
|
MPI_Request_free(&req);
|
||||||
sizeObtained_ = false;
|
|
||||||
|
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
|
|
|
@ -38,21 +38,13 @@ private:
|
||||||
|
|
||||||
uint32 neighborProcNumPoints_ = 0;
|
uint32 neighborProcNumPoints_ = 0;
|
||||||
|
|
||||||
uint32 thisNumPoints_;
|
uint32 thisNumPoints_ = 0;
|
||||||
|
|
||||||
realx3Vector_D neighborProcPoints_;
|
realx3Vector_D neighborProcPoints_;
|
||||||
|
|
||||||
mutable Request sizeRequest_;
|
dataSender<realx3> sender_;
|
||||||
|
|
||||||
mutable Request sSizeRequest_;
|
dataReciever<realx3> reciever_;
|
||||||
|
|
||||||
int req_=0;
|
|
||||||
|
|
||||||
mutable bool sizeObtained_ = true;
|
|
||||||
|
|
||||||
mutable dataSender<realx3> sender_;
|
|
||||||
|
|
||||||
mutable dataReciever<realx3> reciever_;
|
|
||||||
|
|
||||||
mutable bool dataRecieved_ = true;
|
mutable bool dataRecieved_ = true;
|
||||||
|
|
||||||
|
|
|
@ -27,13 +27,11 @@ private:
|
||||||
|
|
||||||
BufferVectorType buffer_;
|
BufferVectorType buffer_;
|
||||||
|
|
||||||
std::vector<T> buffer0_;
|
|
||||||
|
|
||||||
int fromProc_;
|
int fromProc_;
|
||||||
|
|
||||||
int tag_;
|
int tag_;
|
||||||
|
|
||||||
Request recvRequest_;
|
mutable Request recvRequest_ = RequestNull;
|
||||||
|
|
||||||
public:
|
public:
|
||||||
|
|
||||||
|
@ -46,34 +44,40 @@ public:
|
||||||
|
|
||||||
~dataReciever()=default;
|
~dataReciever()=default;
|
||||||
|
|
||||||
|
uint32 waitBufferForUse()const
|
||||||
|
{
|
||||||
|
if(recvRequest_ != RequestNull)
|
||||||
|
{
|
||||||
|
Status status;
|
||||||
|
MPI_Wait(&recvRequest_, &status);
|
||||||
|
int count;
|
||||||
|
CheckMPI(getCount<T>(&status, count), true);
|
||||||
|
|
||||||
|
return static_cast<uint32>(count);
|
||||||
|
}
|
||||||
|
else
|
||||||
|
return buffer_.size();
|
||||||
|
}
|
||||||
|
|
||||||
void recieveData(
|
void recieveData(
|
||||||
const localProcessors& processors,
|
const localProcessors& processors,
|
||||||
uint32 numToRecv
|
uint32 numToRecv
|
||||||
)
|
)
|
||||||
{
|
{
|
||||||
|
waitBufferForUse();
|
||||||
|
buffer_.clear();
|
||||||
|
buffer_.resize(numToRecv);
|
||||||
|
|
||||||
buffer0_.clear();
|
CheckMPI(
|
||||||
buffer0_.resize(numToRecv);
|
Irecv(
|
||||||
MPI_Status status;
|
buffer_.getSpan(),
|
||||||
|
fromProc_,
|
||||||
/*CheckMPI(recv(
|
tag_,
|
||||||
buffer_.getSpan(),
|
processors.localCommunicator(),
|
||||||
fromProc_,
|
&recvRequest_
|
||||||
tag_,
|
),
|
||||||
processors.localCommunicator(),
|
true
|
||||||
&status), true);*/
|
|
||||||
MPI_Recv(
|
|
||||||
buffer0_.data(),
|
|
||||||
buffer0_.size(),
|
|
||||||
realx3Type__,
|
|
||||||
fromProc_,
|
|
||||||
tag_,
|
|
||||||
processors.localCommunicator(),
|
|
||||||
&status
|
|
||||||
);
|
);
|
||||||
int c;
|
|
||||||
getCount<realx3>(&status, c);
|
|
||||||
pOutput<<"Number of data recieved "<<c<<endl;
|
|
||||||
}
|
}
|
||||||
|
|
||||||
auto& buffer()
|
auto& buffer()
|
||||||
|
@ -86,20 +90,6 @@ public:
|
||||||
return buffer_;
|
return buffer_;
|
||||||
}
|
}
|
||||||
|
|
||||||
uint32 waitComplete()
|
|
||||||
{
|
|
||||||
|
|
||||||
/*Status status;
|
|
||||||
|
|
||||||
CheckMPI(MPI_Wait(&recvRequest_, &status), true);
|
|
||||||
|
|
||||||
int count;
|
|
||||||
CheckMPI(getCount<T>(&status, count), true);
|
|
||||||
|
|
||||||
return static_cast<uint32>(count);*/
|
|
||||||
return buffer_.size();
|
|
||||||
}
|
|
||||||
|
|
||||||
};
|
};
|
||||||
|
|
||||||
}
|
}
|
||||||
|
|
|
@ -26,15 +26,13 @@ public:
|
||||||
|
|
||||||
private:
|
private:
|
||||||
|
|
||||||
//BufferVectorType buffer_;
|
BufferVectorType buffer_;
|
||||||
|
|
||||||
std::vector<T> buffer_;
|
|
||||||
|
|
||||||
int toProc_;
|
int toProc_;
|
||||||
|
|
||||||
int tag_;
|
int tag_;
|
||||||
|
|
||||||
Request sendRequest_ = RequestNull;
|
mutable Request sendRequest_ = RequestNull;
|
||||||
|
|
||||||
public:
|
public:
|
||||||
|
|
||||||
|
@ -44,7 +42,22 @@ public:
|
||||||
tag_(tag)
|
tag_(tag)
|
||||||
{}
|
{}
|
||||||
|
|
||||||
~dataSender()=default;
|
~dataSender()
|
||||||
|
{
|
||||||
|
if(sendRequest_ != RequestNull)
|
||||||
|
{
|
||||||
|
MPI_Request_free(&sendRequest_);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
bool waitBufferForUse()const
|
||||||
|
{
|
||||||
|
if(sendRequest_ != RequestNull)
|
||||||
|
{
|
||||||
|
MPI_Wait(&sendRequest_, StatusesIgnore);
|
||||||
|
}
|
||||||
|
return true;
|
||||||
|
}
|
||||||
|
|
||||||
void sendData(
|
void sendData(
|
||||||
const localProcessors& processors,
|
const localProcessors& processors,
|
||||||
|
@ -52,17 +65,21 @@ public:
|
||||||
)
|
)
|
||||||
{
|
{
|
||||||
using RPolicy = Kokkos::RangePolicy<
|
using RPolicy = Kokkos::RangePolicy<
|
||||||
DefaultExecutionSpace,
|
execution_space,
|
||||||
Kokkos::Schedule<Kokkos::Static>,
|
Kokkos::Schedule<Kokkos::Static>,
|
||||||
Kokkos::IndexType<pFlow::uint32>>;
|
Kokkos::IndexType<pFlow::uint32>>;
|
||||||
|
|
||||||
uint32 n = scatterField.size();
|
uint32 n = scatterField.size();
|
||||||
|
|
||||||
|
// make sure the buffer is ready to be used and free
|
||||||
|
// the previous request (if any).
|
||||||
|
waitBufferForUse();
|
||||||
|
|
||||||
// clear the buffer to prevent data copy if capacity increases
|
// clear the buffer to prevent data copy if capacity increases
|
||||||
buffer_.clear();
|
buffer_.clear();
|
||||||
buffer_.resize(n);
|
buffer_.resize(n);
|
||||||
|
|
||||||
auto* buffView = buffer_.data();
|
const auto& buffView = buffer_.deviceViewAll();
|
||||||
|
|
||||||
Kokkos::parallel_for(
|
Kokkos::parallel_for(
|
||||||
"dataSender::sendData",
|
"dataSender::sendData",
|
||||||
|
@ -73,26 +90,20 @@ public:
|
||||||
}
|
}
|
||||||
);
|
);
|
||||||
Kokkos::fence();
|
Kokkos::fence();
|
||||||
auto req = MPI_REQUEST_NULL;
|
|
||||||
|
|
||||||
MPI_Isend(
|
CheckMPI(
|
||||||
buffer_.data(),
|
Isend(buffer_.getSpan(),
|
||||||
buffer_.size(),
|
toProc_,
|
||||||
realx3Type__,
|
tag_,
|
||||||
toProc_,
|
processors.localCommunicator(),
|
||||||
tag_,
|
&sendRequest_
|
||||||
processors.localCommunicator(),
|
),
|
||||||
&req);
|
true
|
||||||
|
);
|
||||||
|
|
||||||
/*CheckMPI(send(
|
|
||||||
buffer_.getSpan(),
|
|
||||||
toProc_,
|
|
||||||
tag_,
|
|
||||||
processors.localCommunicator(),
|
|
||||||
MPI_STATUS_IGNORE), true);*/
|
|
||||||
}
|
}
|
||||||
|
|
||||||
/*auto& buffer()
|
auto& buffer()
|
||||||
{
|
{
|
||||||
return buffer_;
|
return buffer_;
|
||||||
}
|
}
|
||||||
|
@ -100,17 +111,20 @@ public:
|
||||||
const auto& buffer()const
|
const auto& buffer()const
|
||||||
{
|
{
|
||||||
return buffer_;
|
return buffer_;
|
||||||
}*/
|
}
|
||||||
|
|
||||||
bool sendComplete()
|
bool sendComplete()
|
||||||
{
|
{
|
||||||
return true;
|
int test;
|
||||||
/*int test;
|
if(sendRequest_ != RequestNull)
|
||||||
MPI_Test(&sendRequest_, &test, StatusIgnore);
|
{
|
||||||
if(test)
|
MPI_Test(&sendRequest_, &test, StatusIgnore);
|
||||||
return true;
|
return test;
|
||||||
|
}
|
||||||
else
|
else
|
||||||
return false;*/
|
{
|
||||||
|
return true;
|
||||||
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
};
|
};
|
||||||
|
|
Loading…
Reference in New Issue